由于處理能力和存儲空間的制約,移動設備上的文字識別(OCR)一直是一個很大的挑戰(zhàn)。LEADTOOLS正在使用HTML5/JavaScript圖像查看器控件和RESTful Web服務改變這一切。
LEADTOOLS是世界一流的圖像開發(fā)工具包,以“程序員友好”的方式為您提供高質(zhì)量、高性能、高穩(wěn)定性的圖像組件。開發(fā)者可以明顯減少應用程序的開發(fā)時間,從而最大化生產(chǎn)率,保證了最大可能的投資回報。
Google Drive是存儲、組織和分析文件如文檔、圖片和視頻等的完美服務。但是,TIFF和其他光柵圖像文件很容易被忽略,因為Google Drive的搜索功能非常有限。有了LEADTOOLS,就能使用OCR 文字識別提取每個項的文本,并將它添加到IndexableTextData中。這些完成后,就可以像搜索基于文本的文檔如DOC或PDF一樣搜索光柵圖像文件了。
我們經(jīng)常使用表單識別和處理解決各種各樣的任務,包括分類、文檔歸檔、OCR識別和光學標記(OMR)識別。基于OMR表單創(chuàng)建的時間稍長和準確檢測掃描文檔中OMR字段的比較困難,使得OMR在文檔圖像中經(jīng)常被誤解且沒有被充分利用。創(chuàng)建和處理OMR表單非常耗時,此白皮書將討論如何通過自動檢測、分類和處理緩解這些問題。
使用LEADTOOLS創(chuàng)建的應用程序可以將一個掃描文檔與已經(jīng)的模板比較,并對文檔類型正確分類。當正確識別一個文檔后,LEADTOOLS可以從表單中已定義的位置提取文字、選項、條碼等。
在本白皮書中,我們將討論處理大量主表單的若干種策略,以及如何使用LEADTOOLS表單識別SDK快速準確地處理表單。