ABBYY FineReader – phần mềm với công nghệ trí tuệ nhân tạo

30 tháng 3, 2022
ABBYY FineReader – phần mềm với công nghệ trí tuệ nhân tạo

Phần mềm ABBYY FineReader đã có mặt trên thị trường hơn 20 năm. Lúc đầu, chỉ có một sản phẩm địa phương được phát hành với sự hỗ trợ cho các ngôn ngữ chính. Giờ đây đã có giải pháp “đám mây” có thể nhận biết công thức hóa học, ngôn ngữ lập trình.

Phiên bản hiện tại của chương trình đã tích hợp hỗ trợ cho 210 bảng chữ cái OCR và 126 ICR. Một “bước nhảy vọt” như vậy xảy ra nhờ sự ra đời của công nghệ trí tuệ nhân tạo (AI).

Tính năng của ABBYY FineReader

ABBYY FineReader hoạt động với tài liệu ở nhiều định dạng – đây là các tệp PDF kỹ thuật số, tệp được tạo trong trình soạn thảo văn bản, trình chỉnh sửa bảng tính và bản trình bày. Một số định dạng đồ họa cũng được hỗ trợ (hơn 20 phần mở rộng).

Hệ thống cũng hoạt động tự do khi đọc mã vạch, dòng MZR (vùng có thể đọc được bằng máy) và nhận dạng dấu OMR. Kết quả được lưu ở các định dạng DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT.

Các tính năng chính:

  • Phần mềm hoàn toàn tương thích với Windows, MacOS, Linux, các hệ thống nhúng.
  • Hỗ trợ toàn văn, nhận dạng vùng, kết nối từ điển tùy chỉnh với các ký tự không chuẩn.
  • Công nghệ nhận dạng có sẵn thông qua API, bao gồm khả năng tạo sản phẩm của riêng bạn (thư viện SDK được cung cấp).
ABBYY FineReader
ABBYY FineReader
abbyy.com
ABBYY FineReader cho AndroidScan tài liệu cho iOS

Có sẵn hai tùy chọn – phiên bản “đóng hộp” để cài đặt cục bộ và phiên bản đám mây với khả năng kết nối với các dịch vụ OCR từ bất kỳ thiết bị nào: máy tính để bàn, máy tính xách tay, máy tính bảng, điện thoại thông minh. Tùy theo lựa chọn, chỉ có định dạng sử dụng phần mềm thay đổi, chức năng có sẵn 100%.

Trường hợp sử dụng sản phẩm

Xử lý tài liệu trong ABBYY FineReader bao gồm một chuỗi hành động nhất định. Ví dụ: người dùng đặt độ tương phản cao hơn, đặt vùng giới hạn để quét, nhận dạng. Các bộ cài đặt phổ biến sẽ có sẵn ngay sau khi cài đặt phần mềm. Có thể lưu các cài đặt riêng lẻ.

Các tình huống điển hình:

  1. Hệ thống quản lý tài liệu điện tử – chuyển đổi tài liệu sang định dạng PDF nén bằng tính năng tìm kiếm tệp.
  2. Ngăn chặn rò rỉ dữ liệu DLP – chặn quá trình quét khi phát hiện con dấu, chữ ký và các dấu hiệu khác của giấy tờ “cấm lấy ra”.
  3. Thị giác máy – nhận dạng, kiểm soát chất lượng có chọn lọc, phát hiện khuyết tật, đánh dấu công việc, đo lường không tiếp xúc.
  4. Thông tin điện tử eDiscovery – tìm kiếm, lọc nội dung, nguồn, tạo bộ sưu tập để giải quyết thương mại, kiện tụng, điều tra nội bộ.

Cũng đáng bổ sung các công nghệ dành cho người khuyết tật, chẳng hạn như đọc tài liệu, bất kể định dạng tệp. Nhờ cách tiếp cận này, việc xử lý các hợp đồng vay và báo cáo với cơ quan thuế được đẩy nhanh rõ rệt. Các nhà quản lý đang loại bỏ việc nhập tài liệu thủ công, các ngân hàng đang triển khai thanh toán bằng mã QR và các viện bảo tàng đang tự động dịch các tài liệu từ các ngôn ngữ cổ, bao gồm cả bản gốc viết tay.

Tìm hiểu thêm về lợi ích

Nhờ trí tuệ nhân tạo, công nghệ OCR đang được triển khai tích cực trong các hệ thống quản lý và phân tích lượng lớn dữ liệu (Big Data). Ví dụ: tạo hồ sơ bệnh án điện tử, sổ sách công việc, nhập hàng loạt tài liệu kho, kế toán, nhân sự vào cơ sở dữ liệu kế toán, kiểm tra tính đầy đủ, giám sát báo chí. Chương trình sau khi được cấu hình cho một kịch bản và hoạt động tự động.

Lợi ích của công nghệ ABBYY:

  • Khách hàng có quyền truy cập vào các thành phần UI được tạo sẵn để tạo giao diện kiểu công ty của riêng họ.
  • Một tài liệu duy nhất được xử lý với sự lựa chọn miễn phí về các tùy chọn xử lý và xuất.
  • Chất lượng nhận dạng được người dùng xác định từ ba cài đặt có thể (nhanh, chậm, cân bằng).

Sự ra đời của hỗ trợ công nghệ đám mây đã đơn giản hóa việc mở rộng quy mô phần mềm, song song hóa các tác vụ trên kiến ​​trúc máy chủ đa lõi. Nhờ cách tiếp cận này, công việc với OCR diễn ra gần như không bị chậm trễ, bất kể khối lượng và độ phức tạp của vật liệu được nhận dạng. Trong dịch vụ ABBYY FineReader Engine, thật dễ dàng để tạo bất kỳ kịch bản xử lý nào (mẫu mã đơn giản hóa các tác vụ phát triển).

Công nghệ OCR hoạt động như thế nào

Phần mềm nhận dạng văn bản hoạt động theo một thuật toán rõ ràng. Đầu tiên, bằng cách sử dụng giao diện TWAIN hoặc API WIA, tệp sẽ được nhập vào cơ sở dữ liệu. Việc đọc thậm chí còn hoạt động trực tiếp từ bộ nhớ máy tính (ví dụ: màn hình hiện tại của máy tính, điện thoại thông minh). Do đó, không cần máy quét để hoạt động, như trường hợp của các phiên bản đầu tiên của FineReader.

Tiếp theo, chất lượng hình ảnh (độ tương phản, độ sắc nét) tăng lên và mô-đun OCR chính phát huy tác dụng. Trước khi dịch hình ảnh thành văn bản, tài liệu được phân tích về sự hiện diện của các khối cấu trúc với nhiều thông số, ký tự không điển hình.