ABBYY FineReader – software con tecnologia di intelligenza artificiale

30 Marzo 2022
ABBYY FineReader – software con tecnologia di intelligenza artificiale

Il software ABBYY FineReader è sul mercato da oltre 20 anni. Inizialmente è stato rilasciato solo un prodotto locale con il supporto per le lingue principali. Ora esistono soluzioni “cloud” in grado di riconoscere formule chimiche, linguaggi di programmazione.

La versione attuale del programma ha il supporto integrato per gli “alfabeti” 210 OCR e 126 ICR. Un tale “salto” è avvenuto a causa dell’introduzione delle tecnologie di intelligenza artificiale (AI).

Caratteristiche di ABBYY FineReader

ABBYY FineReader funziona con documenti in diversi formati: PDF digitali, file creati in un editor di testo, editor di fogli di calcolo e presentazioni. Sono supportati anche numerosi formati grafici (più di 20 estensioni).

Il sistema funziona liberamente anche durante la lettura di codici a barre, linee MZR (zona leggibile dalla macchina) e riconosce i segni OMR. Il risultato viene salvato nei formati DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT.

Caratteristiche principali:

  • Il software è completamente compatibile con Windows, MacOS, Linux, sistemi embedded.
  • Sono supportati il ​​testo completo, il riconoscimento zonale e la connessione di dizionari personalizzati con caratteri non standard.
  • Le tecnologie di riconoscimento sono disponibili tramite l’API, inclusa la possibilità di creare i propri prodotti (libreria SDK fornita).
ABBYY FineReader
ABBYY FineReader
abbyy.com
ABBYY FineReader per AndroidScansione foto e testo a PDF per iOS

Sono disponibili due opzioni: una versione “boxed” per l’installazione locale e una versione cloud con la possibilità di connettersi ai servizi OCR da qualsiasi dispositivo: computer desktop, laptop, tablet, smartphone. A seconda della scelta, cambia solo il formato di utilizzo del software, la funzionalità è disponibile al 100%.

Casi d’uso del prodotto

L’elaborazione dei documenti in ABBYY FineReader consiste in una determinata sequenza di azioni. Ad esempio, l’utente imposta un contrasto più elevato, imposta un’area limitata per la scansione, il riconoscimento. I set di impostazioni comuni sono disponibili immediatamente dopo l’installazione del software. È possibile salvare impostazioni individuali.

Scenari tipici:

  1. Sistema di gestione elettronica dei documenti: conversione di documenti in formato PDF compresso con ricerca di file.
  2. Prevenzione della perdita di dati DLP: blocca la scansione quando rileva un sigillo, una firma e altri segni di documenti con “vietato estrarre”.
  3. Visione artificiale: identificazione, controllo qualità selettivo, rilevamento difetti, lavori di marcatura, misurazione senza contatto.
  4. Informazioni elettroniche eDiscovery: ricerca, filtra contenuto, fonti, crea raccolte per risolvere questioni commerciali, contenziosi, indagini interne.

Vale anche la pena aggiungere tecnologie per le persone con disabilità, come la lettura di documenti, indipendentemente dal formato del file. Grazie a questo approccio, l’elaborazione dei contratti di prestito e la rendicontazione alle autorità fiscali vengono notevolmente accelerati. I manager si stanno sbarazzando dell’inserimento manuale dei documenti, le banche stanno introducendo il pagamento tramite codici QR e i musei traducono automaticamente i documenti dalle lingue antiche, compresi gli originali scritti a mano.

Ulteriori informazioni sui vantaggi

Grazie all’intelligenza artificiale, le tecnologie OCR vengono attivamente implementate nei sistemi di gestione e analisi di grandi quantità di dati (Big Data). Esempi: creazione di cartelle cliniche elettroniche, libri di lavoro, immissione massiva di magazzino, contabilità, documenti del personale in database contabili, controllo di completezza, monitoraggio della stampa. Il programma viene configurato una volta per uno scenario e funziona automaticamente.

Vantaggi della tecnologia ABBYY:

  • I clienti hanno accesso a componenti dell’interfaccia utente già pronti per creare la propria interfaccia in stile aziendale.
  • Viene elaborato un unico documento con la libera scelta delle opzioni di elaborazione ed esportazione.
  • La qualità del riconoscimento è determinata dall’utente tra tre possibili impostazioni (veloce, lento, bilanciato).

L’introduzione del supporto della tecnologia cloud ha semplificato la scalabilità del software e la parallelizzazione delle attività su un’architettura server multi-core. Grazie a questo approccio, il lavoro con l’OCR avviene quasi senza ritardi, indipendentemente dal volume e dalla complessità del materiale riconosciuto. All’interno del servizio ABBYY FineReader Engine, è facile creare qualsiasi scenario di elaborazione (gli esempi di codice semplificano le attività di sviluppo).

Come funziona la tecnologia OCR

Il software di riconoscimento del testo funziona secondo un algoritmo chiaro. Innanzitutto, utilizzando l’interfaccia TWAIN o l’API WIA, il file viene importato nel database. La lettura funziona anche direttamente dalla memoria del computer (ad esempio, lo schermo corrente di un computer, smartphone). Pertanto per il funzionamento non è necessario uno scanner, come avveniva con le prime versioni di FineReader.

Successivamente, la qualità dell’immagine (contrasto, nitidezza) aumenta ed entra in gioco il modulo OCR principale. Prima di tradurre un’immagine in testo, il documento viene analizzato per la presenza di blocchi strutturali con vari parametri, caratteri atipici.