Toolit on räätälöinyt tekstintunnistuksen ympärille palveluita. Tekstintunnistus eli optinen luenta (engl. Optical Character Recognition - OCR) tarkoittaa tekstin koneellista tunnistamista kuvista sähköiseen muotoon.
Olemme muun muassa kehittäneet palvelun, jota asiakasyrityksemme hyödyntää etsiessään hakusanoja säännöllisesti ilmestyvistä julkaisuista. Julkaisujen sähköiset versiot lähetetään palveluumme, jonka jälkeen dokumenttien teksti tunnistetaan ja verrataan etsittäviin hakusanoihin. Hakusanojen löytyminen raportoidaan sivukohtaisesti. Lisäksi dokumentista tarjotaan asiakkaalle ladattavaksi versio, jossa teksti on tunnistettu, ja johon pystyy tekemään sanahakuja (ns. searchable PDF).
Arkistojen uusi ulottuvuus
Toolit tarjoaa palveluna mahdollisuutta hyödyntää tekstintunnistusta dokumenttien arkistoinnissa. Perinteisesti paperidokumentit on skannattu ja indeksoitu muutamilla tiedoilla, jotka ovat myöhemmin auttaneet dokumenttien löytymisessä sähköisestä arkistosta. Täysi tekstintunnistus dokumentille (Full page OCR) mahdollistaa koko dokumentin tekstin säilömisen tietovarastoon sähköisessä muodossa. Hakujen kohdentaminen tällaiseen tietoon tuo moneen sähköiseen arkistoon uuden ulottuvuuden.
Tarjoamme palveluitamme olemassa olevien paperiarkistojen ja mikrofilmien skannaukseen tai jo kuvattujen (skannattujen) dokumenttien pelkkään tekstintunnistamiseen. Räätälöimme tarvittaessa käyttöön sähköisen arkistosovelluksen ja ratkaisut, joilla dokumentteja voi helposti lisätä arkistoon.