ABBYY FineReader – 人工知能テクノロジーを備えたソフトウェア

2022年3月30日
ABBYY FineReader – 人工知能テクノロジーを備えたソフトウェア

ABBYY FineReaderソフトウェアは 20 年以上にわたって市場に提供されています。当初は、主要言語をサポートするローカル製品のみがリリースされました。現在は、化学式やプログラミング言語を認識できる「クラウド」ソリューションがあります。

プログラムの現在のバージョンには、210 個の OCR と 126 個の ICR の「アルファベット」のサポートが組み込まれています。このような「飛躍」は、人工知能(AI)技術の導入によって起こりました。

ABBYY FineReader の機能

ABBYY FineReader は、デジタル PDF、テキスト エディター、スプレッドシート エディターで作成されたファイル、プレゼンテーションなど、さまざまな形式のドキュメントを処理します。多数のグラフィック形式もサポートされています (20 を超える拡張子)。

このシステムは、バーコード、MZR ライン (機械読み取り可能ゾーン) を読み取るときにも自由に機能し、OMR マークを認識します。結果は、DOCX、RTF、XLSX、HTML、TXT、CSV、XML、XPS、FB2、EPUB、ODT 形式で保存されます。

主な特徴:

  • このソフトウェアは、Windows、MacOS、Linux、組み込みシステムと完全な互換性があります。
  • フルテキスト、ゾーン認識、非標準文字を含むカスタム辞書の接続がサポートされています。
  • 独自の製品を作成する機能 (SDK ライブラリが提供) などの認識テクノロジは API を通じて利用できます。
ABBYY FineReader
ABBYY FineReader
abbyy.com
Android 用 ABBYY FineReaderiOS 用 スキャンアプリ PDF: 書類スキャンと写真

ローカル インストール用の「ボックス」バージョンと、デスクトップ コンピュータ、ラップトップ、タブレット、スマートフォンなどの任意のデバイスから OCR サービスに接続できるクラウド バージョンの 2 つのオプションが利用可能です。選択によっては、ソフトウェアの使用形式が変わるだけで、機能は 100% 利用できます。

製品の使用例

ABBYY FineReader でのドキュメントの処理は、特定の一連のアクションで構成されます。たとえば、ユーザーはより高いコントラストを設定し、スキャンや認識のために制限された領域を設定します。共通の設定セットは、ソフトウェアをインストールした直後に使用できます。個別の設定を保存することが可能です。

典型的なシナリオ:

  1. 電子文書管理システム – ファイル検索を使用して文書を圧縮 PDF 形式に変換します。
  2. DLP データ漏洩防止 – 印鑑、署名、その他の「持ち出し禁止」の書類の兆候が検出された場合、スキャンをブロックします。
  3. マシンビジョン – 識別、選択的品質管理、探傷、マーキング作業、非接触測定。
  4. eDiscovery 電子情報 – 商業、訴訟、内部調査を解決するためのコンテンツ、ソースを検索、フィルターし、コレクションを作成します。

ファイル形式に関係なく、文書を読むなど、障害のある人のためのテクノロジーを追加することも価値があります。このアプローチのおかげで、ローン契約の処理と税務当局への報告が大幅に加速されます。管理者は文書の手入力を廃止し、銀行は QR コードによる支払いを導入し、博物館は手書きの原本を含む古代言語の文書を自動翻訳しています。

メリットについて詳しくはこちら

人工知能のおかげで、OCR テクノロジーは大量のデータ (ビッグデータ) を管理および分析するシステムに積極的に導入されています。例: 電子医療記録、業務簿の作成、倉庫、会計、人事文書の会計データベースへの大量入力、完全性のチェック、報道機関の監視。プログラムは 1 つのシナリオに合わせて設定されると、自動的に動作します。

ABBYY テクノロジーの利点:

  • クライアントは既製の UI コンポーネントにアクセスして、独自の企業スタイルのインターフェイスを作成できます。
  • 単一のドキュメントは、処理オプションとエクスポート オプションを自由に選択して処理されます。
  • 認識の品質は、3 つの設定 (高速、低速、バランス) からユーザーが決定します。

クラウド テクノロジ サポートの導入により、ソフトウェアの拡張、マルチコア サーバー アーキテクチャ全体でのタスクの並列化が簡素化されました。このアプローチのおかげで、認識される素材の量や複雑さに関係なく、OCR での作業はほとんど遅延なく行われます。ABBYY FineReader Engine サービス内では、あらゆる処理シナリオを簡単に作成できます (コード サンプルにより開発タスクが簡素化されます)。

OCR テクノロジーの仕組み

テキスト認識ソフトウェアは、明確なアルゴリズムに従って動作します。まず、TWAIN インターフェイスまたは WIA API を使用して、ファイルがデータベースにインポートされます。読み取りは、コンピューターのメモリ (コンピューターやスマートフォンの現在の画面など) から直接でも機能します。したがって、FineReader の最初のバージョンの場合のように、操作にスキャナは必要ありません。

次に、画質 (コントラスト、シャープネス) が向上し、メインの OCR モジュールが機能します。画像をテキストに翻訳する前に、さまざまなパラメータを含む構造ブロックや特殊な文字の存在が文書内で分析されます。