ABBYY FineReader軟體已上市 20 多年。起初,只發布了支援主要語言的本地產品。現在有可以辨識化學式、程式語言的「雲」解決方案。
該程式的當前版本內建了對 210 個 OCR 和 126 個 ICR「字母」的支援。這樣的「飛躍」是由於人工智慧(AI)技術的引入而發生的。
ABBYY FineReader 功能
ABBYY FineReader 可處理多種格式的文件 – 這些是數位 PDF、在文字編輯器、電子表格編輯器和簡報中建立的文件。也支援多種圖形格式(超過 20 種擴充)。
該系統在讀取條碼、MZR 線(機器可讀區)和識別 OMR 標記時也可以自由運作。結果以 DOCX、RTF、XLSX、HTML、TXT、CSV、XML、XPS、FB2、EPUB、ODT 格式儲存。
主要特徵:
- 軟體完全相容於Windows、MacOS、Linux、嵌入式系統。
- 支援全文、分區辨識、自訂字典與非標準字元的連接。
- 識別技術可透過 API 取得,包括創建自己的產品的能力(提供 SDK 庫)。
有兩種選擇:用於本地安裝的「盒裝」版本和能夠從任何裝置(桌上型電腦、筆記型電腦、平板電腦、智慧型手機)連接到 OCR 服務的雲端版本。根據選擇,僅使用軟體的格式發生變化,功能 100% 可用。
產品用例
ABBYY FineReader 中的文檔處理由一定的操作序列組成。例如,使用者設定較高的對比度,設定有限的掃描、辨識區域。安裝軟體後即可立即使用常用設定集。可以儲存單獨的設定。
典型場景:
- 電子文檔管理系統 – 透過文件搜尋將文件轉換為壓縮 PDF 格式。
- DLP 資料外洩防護 – 當偵測到印章、簽名和其他「禁止取出」文件的標誌時阻止掃描。
- 機器視覺 – 識別、選擇性品質控制、缺陷檢測、標記工作、非接觸式測量。
- 電子取證電子資訊 – 搜尋、過濾內容、來源,建立用於解決商業、訴訟、內部調查的集合。
也值得為殘疾人士添加技術,例如閱讀文檔,無論文件格式如何。由於這種方法,貸款協議的處理和向稅務機關報告的速度顯著加快。管理人員正在擺脫手動輸入文件的情況,銀行正在引入二維碼支付,博物館正在自動翻譯古代語言的文件,包括手寫的原件。
了解更多關於好處的信息
由於人工智慧,OCR 技術正在積極應用於管理和分析大量資料(大數據)的系統中。範例:建立電子病歷、工作簿、倉庫、會計、人事文件批次輸入會計資料庫、完整性檢查、印刷機監控。一旦程式針對一種場景進行配置,就會自動執行。
ABBYY 技術優勢:
- 客戶可以存取現成的 UI 元件來創建自己的企業風格介面。
- 可以自由選擇處理和匯出選項來處理單一文件。
- 識別品質由使用者透過三種可能的設定(快速、慢速、平衡)來決定。
雲端技術支援的引入簡化了軟體的擴展以及多核心伺服器架構中任務的並行化。借助這種方法,無論要識別的材料的數量和複雜程度如何,OCR 工作幾乎都可以立即進行。在 ABBYY FineReader Engine 服務中,可以輕鬆建立任何處理場景(程式碼範例簡化了開發任務)。
OCR 技術的工作原理
文字辨識軟體按照明確的演算法工作。首先,使用 TWAIN 介面或 WIA API,將檔案匯入資料庫。甚至可以直接從電腦記憶體(例如電腦、智慧型手機的當前螢幕)讀取資料。因此,操作不需要掃描儀,就像 FineReader 第一個版本的情況一樣。
接下來,影像品質(對比、清晰度)提高,主要 OCR 模組開始發揮作用。在將圖片翻譯成文字之前,會分析文件是否存在具有各種參數、非典型字元的結構塊。