原創|對比評測|編輯:郝浩|2013-08-23 12:07:35.000|閱讀 1916 次
概述:本文對多款常用OCR軟件的進行了多角度的對比,希望為用戶在選擇和使用OCR軟件時候提供一些實用性參考。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
只要有掃描儀和光學字符識別(OCR)軟件,將掃描文檔轉換成Word文檔是相當容易的。掃描儀將紙質文檔轉換成掃描圖像,而光學字符識別(OCR)軟件則將所掃描的圖像轉換成PDF和Word等可編輯和可搜索的文檔格式。在文檔的轉換過程中,OCR軟件技術主要用來分析和比較帶有數據庫中所存字體的文檔。雖然,OCR軟件的識別準確率不可能達到100%,但是一些OCR軟件包含拼寫檢查功能,可查出無法辨認的字。本文對多款常用OCR軟件的性能進行了多角度的對比,希望為用戶在選擇和使用OCR軟件時候提供一些實用性參考。
名稱 | 支持平臺 | 編程語言 | 字體語言 | 輸出格式 | 備注 |
Tesseract |
Windows/MacOSX /Linux |
C++, C | 40+ | 文本,hOCR,其他 | 開源,支持中文 |
ExperVisionTypeReader |
Windows/MacOSX |
C/C++ | 21 | hOCR | 多次獲獎;不支持中文 |
ABBYY FineReader |
Windows/MacOSX /Linux |
C/C++ | 198 | DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPUB, FB2 | 世界排名第一;識別精度達99%; |
LEADTOOLS |
Windows/MacOSX /Linux |
C/C++, .NET, Objective-C, Java, JavaScript | 56 | PDF, PDF/A, DOC, DOCX, XLS, XPS, RTF, HTML, ANSI Text, Unicode Text, CSV | 支持拉丁語, 亞洲語言,阿拉伯語,MICR字符集;支持整頁或者部分區域的OCR識別; |
CuneiForm/OpenOCR |
Windows/MacOSX /Linux |
C/C++ | 28 | ? | 企業級系統,可以保存文本格式,并識別結構的復雜表格 |
Image to OCR Converter | Windows | C/C++, VB , .NET | 40 | PDF, Word, HTML, Text | 讀取的圖像格式和PDF文件,并可以從照相機掃描圖像 |
Dynamsoft OCR SDK | Windows | C/C++ | 40+ | PDF, TXT | - |
Puma.NET | Windows | C# | 28 | ? | - |
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn