ABBYY FineReader: software con tecnología de inteligencia artificial

30 de marzo de 2022
ABBYY FineReader: software con tecnología de inteligencia artificial

El software ABBYY FineReader lleva más de 20 años en el mercado. Al principio, sólo se lanzó un producto local con soporte para los idiomas principales. Ahora existen soluciones «en la nube» que pueden reconocer fórmulas químicas y lenguajes de programación.

La versión actual del programa tiene soporte incorporado para 210 «alfabetos» OCR y 126 ICR. Este «salto» se produjo gracias a la introducción de tecnologías de inteligencia artificial (IA).

Funciones de ABBYY FineReader

ABBYY FineReader trabaja con documentos en varios formatos: archivos PDF digitales, archivos creados en un editor de texto, editor de hojas de cálculo y presentaciones. También se admiten varios formatos gráficos (más de 20 extensiones).

El sistema también funciona libremente al leer códigos de barras, líneas MZR (zona legible por máquina) y reconoce marcas OMR. El resultado se guarda en formatos DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT.

Características clave:

  • El software es totalmente compatible con Windows, MacOS, Linux y sistemas integrados.
  • Se admite texto completo, reconocimiento zonal y conexión de diccionarios personalizados con caracteres no estándar.
  • Las tecnologías de reconocimiento están disponibles a través de la API, incluida la capacidad de crear sus propios productos (se proporciona la biblioteca SDK).
ABBYY FineReader
ABBYY FineReader
abbyy.com
ABBYY FineReader para AndroidABBYY FineReader para iOS

Hay dos opciones disponibles: una versión «en caja» para instalación local y una versión en la nube con la capacidad de conectarse a servicios OCR desde cualquier dispositivo: computadora de escritorio, computadora portátil, tableta, teléfono inteligente. Dependiendo de la elección, solo cambia el formato de uso del software, la funcionalidad está 100% disponible.

Casos de uso del producto

El procesamiento de documentos en ABBYY FineReader consta de una determinada secuencia de acciones. Por ejemplo, el usuario establece un contraste más alto, establece un área limitada para escaneo y reconocimiento. Los conjuntos de configuraciones comunes están disponibles inmediatamente después de instalar el software. Es posible guardar configuraciones individuales.

Escenarios típicos:

  1. Sistema de gestión de documentos electrónicos: conversión de documentos a formato PDF comprimido con búsqueda de archivos.
  2. Prevención de fuga de datos DLP: bloquea el escaneo cuando detecta un sello, una firma y otros signos de documentos «prohibidos sacar».
  3. Visión artificial: identificación, control de calidad selectivo, detección de defectos, trabajos de marcado, medición sin contacto.
  4. Información electrónica de eDiscovery: busque, filtre contenido, fuentes, cree colecciones para resolver investigaciones comerciales, litigios e internas.

También vale la pena agregar tecnologías para personas con discapacidad, como la lectura de documentos, independientemente del formato del archivo. Gracias a este enfoque, se acelera notablemente la tramitación de los contratos de préstamo y la presentación de informes a las autoridades fiscales. Los administradores se están deshaciendo de la entrada manual de documentos, los bancos están introduciendo el pago mediante códigos QR y los museos están traduciendo automáticamente documentos de idiomas antiguos, incluidos los originales escritos a mano.

Conozca más sobre los beneficios

Gracias a la inteligencia artificial, las tecnologías OCR se están implementando activamente en sistemas de gestión y análisis de grandes cantidades de datos (Big Data). Ejemplos: creación de registros médicos electrónicos, libros de trabajo, entrada masiva de almacenes, contabilidad, documentos de personal en bases de datos contables, control de integridad, seguimiento de la prensa. El programa se configura una vez para un escenario y funciona automáticamente.

Beneficios de la tecnología ABBYY:

  • Los clientes tienen acceso a componentes de interfaz de usuario listos para usar para crear su propia interfaz de estilo corporativo.
  • Se procesa un único documento con libre elección de opciones de procesamiento y exportación.
  • La calidad del reconocimiento la determina el usuario entre tres configuraciones posibles (rápido, lento, equilibrado).

La introducción del soporte de tecnología en la nube ha simplificado la ampliación del software y la paralelización de tareas en una arquitectura de servidor multinúcleo. Gracias a este enfoque, el trabajo con OCR se produce casi sin demora, independientemente del volumen y la complejidad del material que se reconoce. Dentro del servicio ABBYY FineReader Engine, es fácil crear cualquier escenario de procesamiento (los ejemplos de código simplifican las tareas de desarrollo).

Cómo funciona la tecnología OCR

El software de reconocimiento de texto funciona según un algoritmo claro. Primero, utilizando la interfaz TWAIN o la API WIA, el archivo se importa a la base de datos. La lectura funciona incluso directamente desde la memoria de la computadora (por ejemplo, la pantalla actual de una computadora, teléfono inteligente). Por lo tanto, no se necesita un escáner para su funcionamiento, como ocurría con las primeras versiones de FineReader.

A continuación, la calidad de la imagen (contraste, nitidez) aumenta y entra en juego el módulo principal de OCR. Antes de traducir una imagen a texto, se analiza el documento para detectar la presencia de bloques estructurales con varios parámetros y caracteres atípicos.