轉(zhuǎn)帖|使用教程|編輯:黃竹雯|2016-07-15 15:10:39.000|閱讀 3197 次
概述:LeadTools為.NET(C# & VB.NET)、C/C++、Java和Web開發(fā)者提供了快速且精確度高的 OCR SDK技術(shù)。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
LeadTools為.NET(C# & VB.NET)、C/C++、Java和Web開發(fā)者提供了快速且精確度高的 OCR SDK技術(shù)。利用LeadTools高級(jí)OCR工具包,可以快速的開發(fā)健壯的、可擴(kuò)展的、高性能識(shí)別的文檔處理應(yīng)用程序,這些應(yīng)用程序可提取出掃描文件中的文本,將圖像轉(zhuǎn)化為文本搜索格式,如PDF、PDF/A、DOC、DOCX、XML、XPS等。LeadTools廣泛支持40余種字符集,編程者通過提供多語言的解決方案擴(kuò)展用戶群,包括英語、西班牙語、法語、德語、日語、中文、阿拉伯語等。
本文將為大家介紹:
1 選擇您將要使用的引擎類型,并創(chuàng)建一個(gè)接口實(shí)例。更多信息,可參考。
2 使用方法啟動(dòng)OCR引擎。更多信息,可參考。
3 創(chuàng)建一個(gè)一頁或多頁的OCR文檔。更多信息,可參考。
4 手動(dòng)或自動(dòng)的在頁面上建立區(qū)域。(此步驟是可選的。一個(gè)頁面無論有沒有區(qū)域,都是可識(shí)別的。)更多信息,可參考。
5 可選。設(shè)置OCR引擎正在使用的語言(默認(rèn)為英文)。更多信息,可參考。
6 可選。設(shè)置拼寫檢查語言(默認(rèn)為英文)。更多信息,可參考。
7 可選。設(shè)置任意特殊的識(shí)別模塊選項(xiàng)。如果一個(gè)頁面內(nèi)包括自動(dòng)或手動(dòng)創(chuàng)建的區(qū)域,這些選項(xiàng)是需要的。更多信息,可參考, and 。
8 識(shí)別。更多信息,可參考。
9 若需要,保存識(shí)別結(jié)果。結(jié)果可保存為一個(gè)文件或保存至內(nèi)存。更多信息,可參考。
10 當(dāng)結(jié)束時(shí)關(guān)閉OCR引擎。更多信息,可參考。
步驟4、5、6、7可以以任意順序執(zhí)行,只要它們?cè)贠CR引擎啟動(dòng)后、識(shí)別頁面前執(zhí)行了即可。
下面為您提供了”使用OCR識(shí)別圖像中的中文“的示例代碼。為了運(yùn)行此代碼,請(qǐng)點(diǎn)擊下載LeadTools全功能試用版。
安裝全功能試用版后,由于此應(yīng)用程序要識(shí)別中文,因此在創(chuàng)建應(yīng)用程序之,請(qǐng)點(diǎn)擊下載LeadTools OCR語言擴(kuò)展包。
安裝完OCR語言擴(kuò)展包,我們就可以開始創(chuàng)建“使用OCR識(shí)別中文”的應(yīng)用程序了,我們將最終的識(shí)別結(jié)果保存為.docx格式。
1. 打開Visual Studio .NET。點(diǎn)擊 文件->新建->項(xiàng)目…。打開新建項(xiàng)目對(duì)話框后,在模板中選擇“Visual C#”,隨后選擇“Windows窗體應(yīng)用程序”。在名稱欄中輸入項(xiàng)目名稱“SampleOcrChinese”,并使用“瀏覽”按鈕選擇您工程的存儲(chǔ)路徑,點(diǎn)擊“確定”。
2. 在“解決方案資源管理器”中,右擊“引用”,選擇“添加引用”。根據(jù)當(dāng)前工程的 Framework 版本和生成目標(biāo)平臺(tái),選擇添加相應(yīng)的LeadTools控件,例如工程中的版本為 Framework 4.0、生成目標(biāo)平臺(tái)是 x86,則瀏覽選擇Leadtools For .NET文件夾” LEADTOOLS_INSTALLDIR\Bin\DotNet4\Win32”,選擇以下的DLL“:
點(diǎn)擊“確定”按鈕,將以上所有的DLL添加到應(yīng)用程序中。
注意:添加Leadtools.Codecs.*.dll引用后,可使用BMP、JPG、CMP、TIF和FAX圖像文件格式。如果您想使用更多的文件格式,可添加相關(guān)文件格式的codec DLL至應(yīng)用程序。
3. 拖拽5個(gè)button控件至Form1。Button的名稱默認(rèn)為“button1,button2…”,根據(jù)以下表格修改相應(yīng)的Text屬性:
Name | Text |
---|---|
button1 | 啟動(dòng)OCR引擎 |
button2 | 添加頁面 |
button3 | 刪除頁面 |
button4 | 識(shí)別文檔(中文)并保存為Word |
button5 | 關(guān)閉OCR引擎 |
4. 將Form1切換至代碼視圖,將以下代碼添加至using 部分:
using Leadtools; using Leadtools.Codecs; using Leadtools.Forms; using Leadtools.Forms.DocumentWriters; using Leadtools.Forms.Ocr; using Leadtools.ImageProcessing; using Leadtools.WinForms;
5. 將以下私有變量添加至Form1類:
private IOcrEngine _ocrEngine; private IOcrDocument _ocrDocument;
6. 將以下代碼添加至Form1的構(gòu)造函數(shù):
InitializeComponent(); // 解鎖OCR功能,用您的密鑰替換此處 string MY_LICENSE_FILE = "d:\\temp\\TestLic.lic"; string MY_DEVELOPER_KEY = "xyz123abc"; RasterSupport.SetLicense(MY_LICENSE_FILE, MY_DEVELOPER_KEY); // 初始化OCR引擎 _ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Professional, false);
7. 將以下代碼添加至button1(啟動(dòng)OCR引擎)按鈕的Click句柄中,啟動(dòng)OCR引擎,在此部分將識(shí)別的語言設(shè)置為中文簡體:
// 啟動(dòng)OCR引擎 _ocrEngine.Startup(null, null, null, @"D:\LEADTOOLS 18\Bin\Common\OcrProfessionalRuntime"); // 創(chuàng)建文檔 _ocrDocument = _ocrEngine.DocumentManager.CreateDocument(); //將語言設(shè)置為中文簡體,中文繁體為"zh-Hant" _ocrEngine.LanguageManager.EnableLanguages(new string[] {"zh-Hans"}); MessageBox.Show("OCR引擎成功啟動(dòng)");
8. 將以下代碼添加至button2(添加頁面)的Click句柄中,將單頁圖像文件添加至OCR文檔:
string fileName = Path.Combine(Application.StartupPath, @"..\..\Pic\chineseImage.bmp"); //將包含中文字符的文件添加至OCR文檔 IOcrPage page = _ocrDocument.Pages.AddPage(fileName, null); int pageCount = _ocrDocument.Pages.Count; // // 顯示此頁面的相關(guān)信息 string message = string.Format( "共{0}頁\n最后添加的頁面大小 = {1} * {2}\n分辨率 = {3} * {4}\n每個(gè)像素的位數(shù) = {5}\n", pageCount, page.Width, page.Height, page.DpiX, page.DpiY, page.BitsPerPixel); MessageBox.Show(message);
9. 將以下代碼添加至button3(刪除頁面)的Click句柄,從OCR文檔中移走了所有頁面:
// 從OCR文檔中移除所有添加的頁面 _ocrDocument.Pages.Clear(); MessageBox.Show("所有頁面已被移除");
10. 將以下代碼添加至button4(識(shí)別文檔(中文)并保存為Word)的Click句柄,識(shí)別文檔中的中文字符,并將識(shí)別的結(jié)果保存為Word文檔:
// 識(shí)別所有頁面 // 注意,我們不需要調(diào)用AutoZone,引擎會(huì)檢查頁面是否被分區(qū),若無,則會(huì)自動(dòng)分區(qū) _ocrDocument.Pages.Recognize(null); // 將結(jié)果保存為Word文檔 string wordFileName = Path.Combine(Application.StartupPath, @"..\..\Result\Result.docx"); _ocrDocument.Save(wordFileName, DocumentFormat.Docx, null); // 顯示我們剛剛保存的word文件 System.Diagnostics.Process.Start(wordFileName);
11. 將以下代碼添加至button5(關(guān)閉OCR引擎)按鈕的Click句柄,關(guān)閉OCR引擎:
// 釋放此文檔 _ocrDocument.Dispose(); // 關(guān)閉OCR引擎 _ocrEngine.Shutdown(); MessageBox.Show("OCR引擎關(guān)閉");
此段代碼會(huì)將最終的識(shí)別結(jié)果保存為PDF文件。可按照依照以下步驟:啟動(dòng)OCR引擎->添加頁面->識(shí)別文檔(中文)并保存為Word->刪除頁面->關(guān)閉OCR引擎。
12. 編譯、運(yùn)行程序。結(jié)果如下圖:
原圖像為:
運(yùn)行程序識(shí)別過程的截圖如下:
DEMO下載:
文章轉(zhuǎn)自:葡萄城控件產(chǎn)品博客,//blog.gcpowertools.com.cn
如果你想體驗(yàn)LeadTools OCR識(shí)別中文的效果,不妨查看并免費(fèi)下載LeadTools試用版自己試試!
如需幫助,請(qǐng)聯(lián)系!
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn