ABBYY FineReader — программа с технологией искусственного интеллекта

30 марта 2022 г.
ABBYY FineReader — программа с технологией искусственного интеллекта

Программное обеспечение ABBYY FineReader известно на рынке более 20 лет. Сначала выпускали только локальный продукт с поддержкой основных языков. Сейчас же существуют и «облачные» решения, способные распознавать химические формулы, языки программирования.

В актуальной версии программы встроена поддержка 210 OCR и 126 ICR «алфавитов». Такой «скачок» произошел за счет внедрения технологий искусственного интеллекта (ИИ).

Возможности ABBYY FineReader

Программа ABBYY FineReader работает с документами нескольких форматов – это цифровые PDF, файлы, созданные в текстовом, табличном редакторе, презентации. Также поддерживается ряд графических форматов (более 20 расширений).

Система свободно функционирует и при считывании штрих-кодов, MZR-строк (машиночитаемой зоны), распознает метки OMR. Результат сохраняется в форматах DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT.

Основные возможности:

  • Программное обеспечение полностью совместимо с платформами Windows, MacOS, Linux, встраиваемыми системами.
  • Поддерживается полнотекстовое, зональное распознавание, подключение пользовательских словарей с нестандартными символами.
  • Технологии распознавания доступны через интерфейс API, включая возможность создания собственных продуктов (библиотека SDK предоставляется).
ABBYY FineReader
ABBYY FineReader
abbyy.com
ABBYY FineReader для AndroidFineReader: Сканер документов для iOS

Доступно два варианта – «коробочная» версия для локальной установки и облачная с возможностью подключения к сервисам OCR с любого устройства: настольного компьютера, ноутбука, планшета, смартфона. В зависимости от выбора изменяется лишь формат использования ПО, функционал доступен на 100%.

Сценарии применения продукта

Процесс обработки документов в ABBYY FineReader состоит из определенной последовательности действий. Например, пользователь выставляет более высокую контрастность, задает ограниченную область сканирования, распознавания. Распространенные наборы настроек доступны сразу после инсталляции ПО. Есть возможность сохранять индивидуальные параметры.

Типовые сценарии:

  1. Система электронного документооборота – конвертация документов в сжатый формат PDF с поиском по файлам.
  2. Предотвращение утечек данных DLP – блокировка сканирования при обнаружении печати, подписи, других признаков «запрещенных к выносу» бумаг.
  3. Машинное зрение – идентификация, выборочный контроль качества, дефектоскопия, работа с маркировкой, бесконтактное измерение.
  4. Электронная информация eDiscovery – поиск, фильтрация контента, источников, создание подборок для решения коммерческих, судебных споров, внутренние расследования.

Сюда же стоит добавить технологии для людей с ограниченными возможностями вроде прочтения документов независимо от формата файла. Благодаря такому подходу заметно ускоряется обработка кредитных договоров, отчетности перед налоговыми органами. Менеджеры избавляются от ручного ввода документов, банки внедряют оплату по QR-кодам, а музеи автоматически переводят бумаги с древних языков, включая рукописные оригиналы.

Подробнее о преимуществах

Благодаря искусственному интеллекту технологии OCR активно внедряются в системы управления и анализа больших объемов данных (Big Data). Примеры: создание электронных медицинских карт, трудовых книжек, массовый ввод в учетные базы складских, бухгалтерских, кадровых документов, проверка комплектности, мониторинг прессы. Программа однажды настраивается на один сценарий и работает автоматически.

Преимущества технологий ABBYY:

  • Клиентам открывается доступ к готовым UI-компонентам для создания своего интерфейса в корпоративном стиле.
  • Обработка одного документа осуществляется со свободным выбором параметров обработки и экспорта.
  • Качество распознавания определяется пользователем из трех возможных настроек (быстро, медленно, сбалансированно).

Внедрение поддержки облачных технологии упростило масштабирование ПО, распараллеливание задач по многоядерной архитектуре серверов. Благодаря такому подходу работа с OCR происходит практически без задержек независимо от объема, сложности распознаваемого материала. В рамках сервиса ABBYY FineReader Engine легко сформировать любой сценарий обработки (образцы кода упрощают задачи разработки).

Как работает технология OCR

Программное обеспечение по распознаванию текстов работает по четкому алгоритму. Сначала при помощи интерфейса TWAIN или WIA API файл импортируется в базу. Считывание работает даже напрямую из памяти компьютера (например, текущий экран компьютера, смартфона). Поэтому для работы не требуется сканер, как это было с первыми версиями FineReader.

Следом повышается качество изображения (контрастность, четкость) и в дело вступает основной модуль OCR. Перед переводом картинки в текст документ анализируется на предмет наличия в нем структурных блоков с различными параметрами, нетипичными символами.