ABBYY FineReader – 인공 지능 기술이 적용된 소프트웨어

2022년3월30일
ABBYY FineReader – 인공 지능 기술이 적용된 소프트웨어

ABBYY FineReader 소프트웨어는 시장에 출시된 지 20년이 넘었습니다. 처음에는 주요 언어를 지원하는 로컬 제품만 출시되었습니다. 이제 화학 공식, 프로그래밍 언어를 인식할 수 있는 “클라우드” 솔루션이 있습니다.

현재 버전의 프로그램에는 210 OCR 및 126 ICR “알파벳”에 대한 지원이 내장되어 있습니다. 이런 ‘도약’은 인공지능(AI) 기술의 도입으로 일어났다.

ABBYY FineReader 기능

ABBYY FineReader는 디지털 PDF, 텍스트 편집기에서 생성된 파일, 스프레드시트 편집기 및 프레젠테이션 등 다양한 형식의 문서를 작업합니다. 다양한 그래픽 형식도 지원됩니다(20개 이상의 확장자).

또한 시스템은 바코드, MZR 라인(기계 판독 가능 영역)을 읽을 때 자유롭게 작동하고 OMR 마크를 인식합니다. 결과는 DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT 형식으로 저장됩니다.

주요 특징들:

  • 이 소프트웨어는 Windows, MacOS, Linux, 임베디드 시스템과 완벽하게 호환됩니다.
  • 전체 텍스트, 영역 인식, 비표준 문자가 포함된 사용자 정의 사전 연결이 지원됩니다.
  • 자신만의 제품을 만드는 기능(SDK 라이브러리 제공)을 포함하여 인식 기술을 API를 통해 사용할 수 있습니다.
ABBYY FineReader
ABBYY FineReader
abbyy.com
Android용 ABBYY FineReaderiOS용 FineReader: PDF 스캐너, 사진스캔

로컬 설치를 위한 “박스형” 버전과 데스크톱 컴퓨터, 노트북, 태블릿, 스마트폰 등 모든 장치에서 OCR 서비스에 연결할 수 있는 클라우드 버전의 두 가지 옵션을 사용할 수 있습니다. 선택에 따라 소프트웨어 사용 형식만 달라지며, 기능은 100% 사용할 수 있습니다.

제품 사용 사례

ABBYY FineReader에서 문서 처리는 일련의 특정 작업으로 구성됩니다. 예를 들어 사용자는 대비를 더 높게 설정하고 스캔, 인식을 위한 제한된 영역을 설정합니다. 공통 설정 세트는 소프트웨어 설치 후 즉시 사용할 수 있습니다. 개별 설정을 저장할 수 있습니다.

일반적인 시나리오:

  1. 전자 문서 관리 시스템 – 파일 검색을 통해 문서를 압축된 PDF 형식으로 변환합니다.
  2. DLP 데이터 유출 방지 – 인감, 서명 및 기타 “반출 금지” 징후가 감지되면 스캔을 차단합니다.
  3. 머신 비전 – 식별, 선택적 품질 관리, 결함 감지, 마킹 작업, 비접촉 측정.
  4. eDiscovery 전자 정보 – 검색, 콘텐츠 필터링, 소스, 상업, 소송, 내부 조사 해결을 위한 컬렉션 생성.

파일 형식에 관계없이 문서를 읽는 등 장애인을 위한 기술을 추가하는 것도 가치가 있다. 이러한 접근 방식 덕분에 대출 계약 처리 및 세무 당국에 대한 보고가 눈에 띄게 가속화되었습니다. 관리자들은 문서를 수동으로 입력하는 일을 없애고, 은행은 QR 코드를 통한 결제를 도입하고 있으며, 박물관에서는 손으로 쓴 원본을 포함한 고대 언어의 서류를 자동으로 번역하고 있습니다.

혜택에 대해 자세히 알아보기

인공지능 덕분에 대용량 데이터(빅데이터)를 관리하고 분석하는 시스템에 OCR 기술이 활발히 구현되고 있다. 예: 전자 의료 기록 생성, 통합 문서, 창고 대량 입력, 회계, 회계 데이터베이스에 인사 문서, 완전성 확인, 언론 모니터링. 프로그램은 하나의 시나리오에 대해 구성되면 자동으로 작동됩니다.

ABBYY 기술 이점:

  • 클라이언트는 기성 UI 구성요소에 액세스하여 자신만의 기업 스타일 인터페이스를 만들 수 있습니다.
  • 단일 문서는 처리 및 내보내기 옵션을 자유롭게 선택하여 처리됩니다.
  • 인식 품질은 사용자가 세 가지 가능한 설정(빠름, 느림, 균형) 중에서 결정합니다.

클라우드 기술 지원의 도입으로 소프트웨어 확장, 멀티 코어 서버 아키텍처 전반의 작업 병렬화가 단순화되었습니다. 이러한 접근 방식 덕분에 인식되는 자료의 양과 복잡성에 관계없이 OCR 작업이 거의 지연 없이 이루어집니다. ABBYY FineReader 엔진 서비스 내에서는 모든 처리 시나리오를 쉽게 만들 수 있습니다(코드 샘플은 개발 작업을 단순화합니다).

OCR 기술 작동 방식

텍스트 인식 소프트웨어는 명확한 알고리즘에 따라 작동합니다. 먼저 TWAIN 인터페이스 또는 WIA API를 사용하여 파일을 데이터베이스로 가져옵니다. 읽기는 컴퓨터 메모리(예: 컴퓨터의 현재 화면, 스마트폰)에서 직접 수행되는 경우에도 작동합니다. 따라서 FineReader의 첫 번째 버전처럼 작동을 위해 스캐너가 필요하지 않습니다.

다음으로 이미지 품질(대비, 선명도)이 향상되고 기본 OCR 모듈이 작동합니다. 그림을 텍스트로 번역하기 전에 문서에 다양한 매개변수, 비정형 문자가 포함된 구조적 블록이 있는지 분석됩니다.