ABBYY FineReader – Software mit künstlicher Intelligenz-Technologie

30. März 2022
ABBYY FineReader – Software mit künstlicher Intelligenz-Technologie

Die Software ABBYY FineReader ist seit über 20 Jahren auf dem Markt. Zunächst wurde nur ein lokales Produkt mit Unterstützung für die Hauptsprachen veröffentlicht. Mittlerweile gibt es „Cloud“-Lösungen, die chemische Formeln und Programmiersprachen erkennen können.

Die aktuelle Version des Programms verfügt über integrierte Unterstützung für 210 OCR- und 126 ICR-„Alphabete“. Ein solcher „Sprung“ erfolgte aufgrund der Einführung von Technologien der künstlichen Intelligenz (KI).

ABBYY FineReader-Funktionen

ABBYY FineReader arbeitet mit Dokumenten in verschiedenen Formaten – das sind digitale PDFs, in einem Texteditor oder Tabellenkalkulationseditor erstellte Dateien und Präsentationen. Darüber hinaus werden zahlreiche Grafikformate unterstützt (mehr als 20 Erweiterungen).

Das System funktioniert auch frei beim Lesen von Barcodes, MZR-Zeilen (maschinenlesbare Zone) und erkennt OMR-Markierungen. Das Ergebnis wird in den Formaten DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT gespeichert.

Hauptmerkmale:

  • Die Software ist vollständig kompatibel mit Windows, MacOS, Linux und eingebetteten Systemen.
  • Volltext, Zonenerkennung und Anbindung benutzerdefinierter Wörterbücher mit nicht standardmäßigen Zeichen werden unterstützt.
  • Über die API sind Erkennungstechnologien verfügbar, einschließlich der Möglichkeit, eigene Produkte zu erstellen (SDK-Bibliothek bereitgestellt).
ABBYY FineReader
ABBYY FineReader
abbyy.com
ABBYY FineReader für AndroidABBYY FineReader für iOS

Es stehen zwei Optionen zur Verfügung – eine „Boxed“-Version für die lokale Installation und eine Cloud-Version mit der Möglichkeit, von jedem Gerät aus eine Verbindung zu OCR-Diensten herzustellen: Desktop-Computer, Laptop, Tablet, Smartphone. Je nach Wahl ändert sich lediglich das Format der Nutzung der Software, die Funktionalität steht zu 100 % zur Verfügung.

Produktanwendungsfälle

Die Verarbeitung von Dokumenten in ABBYY FineReader besteht aus einer bestimmten Abfolge von Aktionen. Beispielsweise stellt der Benutzer einen höheren Kontrast ein und legt einen begrenzten Bereich zum Scannen und Erkennen fest. Gemeinsame Einstellungssätze stehen sofort nach der Installation der Software zur Verfügung. Es besteht die Möglichkeit, individuelle Einstellungen zu speichern.

Typische Szenarien:

  1. Elektronisches Dokumentenmanagementsystem – Konvertierung von Dokumenten in komprimiertes PDF-Format mit Dateisuche.
  2. DLP Data Leak Prevention – Blockiert das Scannen, wenn ein Siegel, eine Unterschrift oder andere Anzeichen dafür erkannt werden, dass das Herausnehmen von Papieren verboten ist.
  3. Bildverarbeitung – Identifizierung, selektive Qualitätskontrolle, Fehlererkennung, Markierungsarbeiten, berührungslose Messung.
  4. Elektronische eDiscovery-Informationen – Suchen, Filtern von Inhalten und Quellen, Erstellen von Sammlungen zur Lösung kommerzieller, gerichtlicher und interner Untersuchungen.

Es lohnt sich auch, Technologien für Menschen mit Behinderungen hinzuzufügen, beispielsweise das Lesen von Dokumenten, unabhängig vom Dateiformat. Dank dieser Vorgehensweise wird die Bearbeitung von Kreditverträgen und die Meldung an das Finanzamt spürbar beschleunigt. Manager verzichten auf die manuelle Eingabe von Dokumenten, Banken führen Zahlungen per QR-Code ein und Museen übersetzen automatisch Dokumente aus alten Sprachen, darunter auch handschriftliche Originale.

Erfahren Sie mehr über die Vorteile

Dank künstlicher Intelligenz werden OCR-Technologien aktiv in Systemen zur Verwaltung und Analyse großer Datenmengen (Big Data) eingesetzt. Beispiele: Erstellung elektronischer Krankenakten, Arbeitsbücher, Masseneingabe von Lager, Buchhaltung, Personaldokumente in Buchhaltungsdatenbanken, Vollständigkeitsprüfung, Überwachung der Presse. Das Programm wird einmal für ein Szenario konfiguriert und funktioniert automatisch.

Vorteile der ABBYY-Technologie:

  • Kunden haben Zugriff auf vorgefertigte UI-Komponenten, um ihre eigene Benutzeroberfläche im Unternehmensstil zu erstellen.
  • Die Bearbeitung eines einzelnen Dokuments erfolgt mit frei wählbaren Bearbeitungs- und Exportoptionen.
  • Die Qualität der Erkennung bestimmt der Nutzer aus drei möglichen Einstellungen (schnell, langsam, ausgewogen).

Die Einführung der Cloud-Technologie-Unterstützung hat die Skalierung von Software und die Parallelisierung von Aufgaben in einer Multi-Core-Serverarchitektur vereinfacht. Dank dieses Ansatzes erfolgt die Arbeit mit OCR nahezu verzögerungsfrei, unabhängig vom Umfang und der Komplexität des zu erkennenden Materials. Innerhalb des ABBYY FineReader Engine-Dienstes ist es einfach, jedes beliebige Verarbeitungsszenario zu erstellen (Codebeispiele vereinfachen Entwicklungsaufgaben).

So funktioniert die OCR-Technologie

Texterkennungssoftware arbeitet nach einem klaren Algorithmus. Zunächst wird die Datei über die TWAIN-Schnittstelle oder die WIA-API in die Datenbank importiert. Das Lesen funktioniert sogar direkt aus dem Computerspeicher (zum Beispiel dem aktuellen Bildschirm eines Computers, Smartphones). Daher ist für den Betrieb kein Scanner erforderlich, wie dies bei den ersten Versionen von FineReader der Fall war.

Als nächstes steigt die Bildqualität (Kontrast, Schärfe) und das Haupt-OCR-Modul kommt ins Spiel. Bevor ein Bild in Text übersetzt wird, wird das Dokument auf das Vorhandensein von Strukturblöcken mit verschiedenen Parametern und atypischen Zeichen analysiert.