ABBYY FineReader – ซอฟต์แวร์พร้อมเทคโนโลยีปัญญาประดิษฐ์

30 มีนาคม 2022
ABBYY FineReader – ซอฟต์แวร์พร้อมเทคโนโลยีปัญญาประดิษฐ์

ซอฟต์แวร์ABBYY FineReaderอยู่ในตลาดมานานกว่า 20 ปี ในตอนแรกมีเพียงผลิตภัณฑ์ท้องถิ่นเท่านั้นที่ออกโดยรองรับภาษาหลัก ขณะนี้มีโซลูชัน “คลาวด์” ที่สามารถจดจำสูตรทางเคมี ภาษาโปรแกรมได้

โปรแกรมเวอร์ชันปัจจุบันรองรับ “ตัวอักษร” 210 OCR และ 126 ICR ในตัว “การก้าวกระโดด” ดังกล่าวเกิดขึ้นเนื่องจากมีการนำเทคโนโลยีปัญญาประดิษฐ์ (AI) มาใช้

คุณสมบัติ ABBYY FineReader

ABBYY FineReader ทำงานร่วมกับเอกสารได้หลายรูปแบบ ได้แก่ PDF ดิจิทัล ไฟล์ที่สร้างในโปรแกรมแก้ไขข้อความ โปรแกรมแก้ไขสเปรดชีต และการนำเสนอ รองรับรูปแบบกราฟิกจำนวนหนึ่ง (ส่วนขยายมากกว่า 20 รายการ)

ระบบยังทำงานได้อย่างอิสระเมื่ออ่านบาร์โค้ด เส้น MZR (โซนที่เครื่องอ่านได้) และจดจำเครื่องหมาย OMR ผลลัพธ์จะถูกบันทึกในรูปแบบ DOCX, RTF, XLSX, HTML, TXT, CSV, XML, XPS, FB2, EPUB, ODT

คุณสมบัติที่สำคัญ:

  • ซอฟต์แวร์นี้เข้ากันได้กับ Windows, MacOS, Linux, ระบบฝังตัวอย่างสมบูรณ์
  • รองรับข้อความแบบเต็ม การจดจำโซน การเชื่อมต่อพจนานุกรมแบบกำหนดเองกับอักขระที่ไม่ได้มาตรฐาน
  • เทคโนโลยีการจดจำพร้อมใช้งานผ่าน API รวมถึงความสามารถในการสร้างผลิตภัณฑ์ของคุณเอง (มีไลบรารี SDK ให้)
ABBYY FineReader
ABBYY FineReader
abbyy.com
ABBYY FineReader สำหรับ Androidสแกนเนอร์ – สแกนเอกสาร สำหรับ iOS

มีสองตัวเลือกให้เลือก – เวอร์ชัน “บรรจุกล่อง” สำหรับการติดตั้งในเครื่องและเวอร์ชันคลาวด์ที่สามารถเชื่อมต่อกับบริการ OCR จากอุปกรณ์ใดก็ได้: คอมพิวเตอร์เดสก์ท็อป แล็ปท็อป แท็บเล็ต สมาร์ทโฟน เฉพาะรูปแบบการใช้ซอฟต์แวร์เท่านั้นที่เปลี่ยนแปลง ฟังก์ชันการทำงานจะพร้อมใช้งาน 100% ขึ้นอยู่กับตัวเลือก

กรณีการใช้ผลิตภัณฑ์

การประมวลผลเอกสารใน ABBYY FineReader ประกอบด้วยลำดับการดำเนินการบางอย่าง ตัวอย่างเช่น ผู้ใช้ตั้งค่าคอนทราสต์ที่สูงขึ้น กำหนดพื้นที่ที่จำกัดสำหรับการสแกน การจดจำ ชุดการตั้งค่าทั่วไปจะพร้อมใช้งานทันทีหลังจากติดตั้งซอฟต์แวร์ สามารถบันทึกการตั้งค่าส่วนบุคคลได้

สถานการณ์ทั่วไป:

  1. ระบบจัดการเอกสารอิเล็กทรอนิกส์ – แปลงเอกสารเป็นรูปแบบ PDF ที่ถูกบีบอัดพร้อมการค้นหาไฟล์
  2. การป้องกันข้อมูลรั่วไหลของ DLP – บล็อกการสแกนเมื่อตรวจพบตราประทับ ลายเซ็น และสัญญาณอื่นๆ ของกระดาษที่ “ห้ามนำออก”
  3. วิชันซิสเต็ม – การระบุ การควบคุมคุณภาพแบบเลือกสรร การตรวจจับข้อบกพร่อง งานมาร์ก การวัดแบบไม่สัมผัส
  4. ข้อมูลอิเล็กทรอนิกส์ eDiscovery – ค้นหา กรองเนื้อหา แหล่งที่มา สร้างคอลเลกชันสำหรับการแก้ไขเชิงพาณิชย์ การฟ้องร้อง การสืบสวนภายใน

นอกจากนี้ยังคุ้มค่าที่จะเพิ่มเทคโนโลยีให้กับผู้พิการ เช่น การอ่านเอกสาร ไม่ว่าไฟล์จะเป็นรูปแบบใดก็ตาม ด้วยวิธีนี้ การประมวลผลสัญญาเงินกู้และการรายงานต่อหน่วยงานด้านภาษีจึงเร็วขึ้นอย่างเห็นได้ชัด ผู้จัดการกำลังยกเลิกการป้อนเอกสารด้วยตนเอง ธนาคารกำลังแนะนำการชำระเงินด้วยรหัส QR และพิพิธภัณฑ์กำลังแปลเอกสารจากภาษาโบราณโดยอัตโนมัติ รวมถึงต้นฉบับที่เขียนด้วยลายมือ

เรียนรู้เพิ่มเติมเกี่ยวกับสิทธิประโยชน์

ต้องขอบคุณปัญญาประดิษฐ์ เทคโนโลยี OCR จึงถูกนำมาใช้อย่างแข็งขันในระบบสำหรับการจัดการและวิเคราะห์ข้อมูลจำนวนมาก (Big Data) ตัวอย่าง: การสร้างเวชระเบียนอิเล็กทรอนิกส์ สมุดงาน การป้อนข้อมูลจำนวนมากในคลังสินค้า การบัญชี เอกสารบุคลากรลงในฐานข้อมูลทางบัญชี การตรวจสอบความครบถ้วน การติดตามการกด เมื่อโปรแกรมได้รับการกำหนดค่าสำหรับสถานการณ์หนึ่งและทำงานโดยอัตโนมัติ

ประโยชน์ของเทคโนโลยี ABBYY:

  • ลูกค้าสามารถเข้าถึงส่วนประกอบ UI สำเร็จรูปเพื่อสร้างอินเทอร์เฟซสไตล์องค์กรของตนเอง
  • เอกสารฉบับเดียวได้รับการประมวลผลโดยมีตัวเลือกการประมวลผลและส่งออกให้เลือกฟรี
  • ผู้ใช้จะกำหนดคุณภาพของการจดจำจากการตั้งค่าที่เป็นไปได้สามแบบ (เร็ว ช้า และสมดุล)

การเปิดตัวการสนับสนุนเทคโนโลยีคลาวด์ทำให้การปรับขนาดซอฟต์แวร์ง่ายขึ้น การทำงานแบบขนานในสถาปัตยกรรมเซิร์ฟเวอร์แบบมัลติคอร์ ด้วยวิธีนี้ การทำงานกับ OCR จึงเกิดขึ้นได้เกือบจะโดยไม่ชักช้า โดยไม่คำนึงถึงปริมาณและความซับซ้อนของวัสดุที่รับรู้ ภายในบริการ ABBYY FineReader Engine คุณสามารถสร้างสถานการณ์การประมวลผลใดๆ ได้อย่างง่ายดาย (ตัวอย่างโค้ดทำให้งานการพัฒนาง่ายขึ้น)

เทคโนโลยี OCR ทำงานอย่างไร

ซอฟต์แวร์การรู้จำข้อความทำงานตามอัลกอริธึมที่ชัดเจน ขั้นแรก โดยใช้อินเทอร์เฟซ TWAIN หรือ WIA API ไฟล์จะถูกนำเข้าไปยังฐานข้อมูล การอ่านทำงานได้โดยตรงจากหน่วยความจำคอมพิวเตอร์ (เช่น หน้าจอปัจจุบันของคอมพิวเตอร์ สมาร์ทโฟน) ดังนั้นจึงไม่จำเป็นต้องใช้เครื่องสแกนในการทำงาน เช่นเดียวกับ FineReader เวอร์ชันแรก

ถัดไป คุณภาพของภาพ (คอนทราสต์ ความคมชัด) จะเพิ่มขึ้น และโมดูล OCR หลักก็เข้ามามีบทบาท ก่อนที่จะแปลรูปภาพเป็นข้อความ เอกสารจะถูกวิเคราะห์สำหรับการมีอยู่ของบล็อกโครงสร้างที่มีพารามิเตอร์ต่างๆ ซึ่งเป็นอักขระที่ผิดปกติ