ABBYY FineReader – softver s tehnologijom umjetne inteligencije

30. ožujka 2022.
ABBYY FineReader – softver s tehnologijom umjetne inteligencije

Softver ABBYY FineReader na tržištu je više od 20 godina. Isprva je izdavan samo lokalni proizvod s podrškom za glavne jezike. Sada postoje “cloud” rješenja koja mogu prepoznati kemijske formule, programski jezici.

Trenutna verzija programa ima ugrađenu podršku za 210 OCR i 126 ICR “alfabeta”. Takav se “skok” dogodio zbog uvođenja tehnologija umjetne inteligencije (AI).

Značajke ABBYY FineReader

ABBYY FineReader radi s dokumentima u nekoliko formata – to su digitalni PDF-ovi, datoteke stvorene u uređivaču teksta, uređivaču proračunskih tablica i prezentacije. Također je podržan niz grafičkih formata (više od 20 ekstenzija).

Sustav također radi slobodno kada čita barkodove, MZR linije (strojno čitljiva zona) i prepoznaje OMR oznake. Rezultat se sprema u formate DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT.

Glavne značajke:

  • Softver je u potpunosti kompatibilan s Windows, MacOS, Linux, ugrađenim sustavima.
  • Podržani su puni tekst, zonsko prepoznavanje, povezivanje prilagođenih rječnika s nestandardnim znakovima.
  • Tehnologije prepoznavanja dostupne su putem API-ja, uključujući mogućnost izrade vlastitih proizvoda (dostupna biblioteka SDK).
ABBYY FineReader
ABBYY FineReader
abbyy.com
ABBYY FineReader za AndroidABBYY FineReader za iOS

Dostupne su dvije opcije – verzija u kutiji za lokalnu instalaciju i verzija u oblaku s mogućnošću povezivanja na OCR usluge s bilo kojeg uređaja: stolno računalo, prijenosno računalo, tablet, pametni telefon. Ovisno o izboru mijenja se samo format korištenja softvera, funkcionalnost je 100% dostupna.

Slučajevi upotrebe proizvoda

Obrada dokumenata u ABBYY FineReaderu sastoji se od određenog niza radnji. Na primjer, korisnik postavlja veći kontrast, postavlja ograničeno područje za skeniranje, prepoznavanje. Uobičajeni skupovi postavki dostupni su odmah nakon instaliranja softvera. Moguće je spremiti pojedinačne postavke.

Tipični scenariji:

  1. Sustav za elektroničko upravljanje dokumentima – pretvaranje dokumenata u komprimirani PDF format s pretraživanjem datoteka.
  2. DLP Data Leak Prevention – blokiranje skeniranja kada otkrije pečat, potpis i druge znakove “zabranjenog iznošenja” papira.
  3. Strojni vid – identifikacija, selektivna kontrola kvalitete, detekcija grešaka, poslovi označavanja, beskontaktno mjerenje.
  4. eDiscovery elektroničke informacije – pretraživanje, filtriranje sadržaja, izvora, stvaranje zbirki za rješavanje komercijalnih, parničnih sporova, internih istraga.

Također vrijedi dodati tehnologije za osobe s invaliditetom, poput čitanja dokumenata, bez obzira na format datoteke. Zahvaljujući ovakvom pristupu osjetno se ubrzava obrada ugovora o kreditu i prijava poreznoj upravi. Menadžeri se rješavaju ručnog unosa dokumenata, banke uvode plaćanje QR kodovima, a muzeji automatski prevode papire sa starih jezika, uključujući rukopisne originale.

Saznajte više o prednostima

Zahvaljujući umjetnoj inteligenciji, OCR tehnologije se aktivno implementiraju u sustave za upravljanje i analizu velikih količina podataka (Big Data). Primjeri: izrada elektroničkih zdravstvenih kartona, radnih knjižica, masovni unos skladišnih, računovodstvenih, kadrovskih dokumenata u računovodstvene baze podataka, provjera potpunosti, praćenje tiska. Program se jednom konfigurira za jedan scenarij i radi automatski.

Prednosti ABBYY tehnologije:

  • Klijenti imaju pristup gotovim komponentama korisničkog sučelja za stvaranje vlastitog sučelja u korporativnom stilu.
  • Obrađuje se jedan dokument uz slobodan izbor mogućnosti obrade i izvoza.
  • Kvalitetu prepoznavanja određuje sam korisnik iz tri moguće postavke (brzo, sporo, uravnoteženo).

Uvođenje podrške za tehnologiju oblaka pojednostavilo je skaliranje softvera, paraleliziranje zadataka u višejezgrenoj poslužiteljskoj arhitekturi. Zahvaljujući ovom pristupu, rad s OCR-om odvija se gotovo bez odgode, bez obzira na volumen i složenost materijala koji se prepoznaje. Unutar usluge ABBYY FineReader Engine lako je kreirati bilo koji scenarij obrade (uzorci koda pojednostavljuju razvojne zadatke).

Kako OCR tehnologija radi

Softver za prepoznavanje teksta radi prema jasnom algoritmu. Prvo se pomoću TWAIN sučelja ili WIA API-ja datoteka uvozi u bazu podataka. Čitanje funkcionira čak i izravno iz memorije računala (na primjer, trenutni zaslon računala, pametni telefon). Dakle, za rad nije potreban skener, kao što je bio slučaj s prvim verzijama FineReadera.

Zatim se povećava kvaliteta slike (kontrast, oštrina) i glavni OCR modul dolazi u igru. Prije prevođenja slike u tekst, dokument se analizira na prisutnost strukturnih blokova s ​​različitim parametrima, atipičnim znakovima.