Lopputuloksen kannalta se tärkein. Ilman hyvää lähtökohtaa ei tuloksesta saada kunnollista. Siksi on tärkeää tuottaa mahdollisimman hyvä kuva joka sitten annetaan prosessille käsiteltäväksi.
Lisää»
Tehdään käsin, tai ohjelmallisesti. Mieluummin ohjelmallisesti. Käytetään mm. merkintunnistusta, joka "lukee" kaiken, tai vain tarvittavan. Tai luetaan PDF:n tekstikerros (jos on), ja tallennetaan tulos jatkokäsittelyä varten.
Lisää»
Joskus se mitä saadaan luettua on heti sitä mitä halutaan. Usein tieto pitää tarkistaa joko laskemalla tarkiste (esim. hetu, tai IBAN), tai vertaamalla johonkin. Tai sitten vain pitää muuntaa csv xml:ksi, tai toisin pän.
Lisää»