翻譯|使用教程|編輯:李顯亮|2019-10-30 09:38:14.387|閱讀 376 次
概述:PDF是當今最流行的文檔格式之一,各種應用程序將其用作最終輸出。在連載系列中,我們將探索并演示Aspose.PDF for .NET API的強大轉換功能,以使用多種選項讀取PDF文件并將其轉換為HTML。本文介紹將PDF文件轉換為HTML時,將創建一個包含格式信息的CSS文件
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
Aspose.PDF for .NET是一種高級PDF處理和解析API,用于在跨平臺應用程序中執行文檔管理和操作任務。API可以輕松用于生成,修改,轉換,渲染,保護和打印PDF文檔,而無需使用Adobe Acrobat。此外,還提供PDF壓縮選項,表格創建和操作,圖形和圖像功能,廣泛的超鏈接功能,印章和水印任務,擴展的安全控制和自定義字體處理。
PDF是當今最流行的文檔格式之一,各種應用程序將其用作最終輸出。由于支持多種數據類型和可移植性,因此它是創建和共享內容的首選格式。作為對開發文檔管理應用程序感興趣的.NET應用程序開發人員,可能希望嵌入處理功能,以讀取PDF文檔并將其轉換為其他文件格式,例如HTML。
在本文中,我們將探索并演示Aspose.PDF for .NET API的強大轉換功能,以使用多種選項讀取PDF文件并將其轉換為HTML。
將PDF文件轉換為HTML時,將創建一個包含格式信息的CSS文件。Aspose.PDF for .NET還提供了將輸出HTML拆分為頁面的功能,還可以將CSS拆分為多個頁面。
本HtmlSaveOptions類有一個名為屬性SplitIntoPages,它支持的功能和生成文件時輸出HTML文件拆分頁面。如果希望基于單個頁面拆分CSS文件,而不是生成單個CSS文件。要做到這一點,我們引入了一個新的標志,SplitCssIntoPages對HtmlSaveOptions類。當此屬性的值設置為true時,轉換器將根據創建的單個HTML頁面將outout CSS分為多個部分/頁面。以下代碼段顯示了如何使用該標志。
//文檔目錄的路徑。 string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat(); // 1)清理目標文件夾 string htmlFile = Path.GetFullPath(dataDir + "resultant.html"); string imagesDir = Path.GetDirectoryName(htmlFile) + @"\35942_files"; string cssDir = Path.GetDirectoryName(htmlFile) + @"\35942_css_files"; if (Directory.Exists(imagesDir)) { Directory.Delete(imagesDir, true); }; if (Directory.Exists(cssDir)) { Directory.Delete(cssDir, true); }; // 2)創建要轉換的文檔 Document pdfDocument = new Document(dataDir + "input.pdf"); // 3)音調轉換選項 HtmlSaveOptions options = new HtmlSaveOptions(); options.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsPngImagesEmbeddedIntoSvg;//<- to get compatibility with previous behavior and therefore same result of tests // 將 HTML輸出分成頁面 options.SplitIntoPages = true; // 將 CSS分成頁面 options.SplitCssIntoPages = true; options.CustomCssSavingStrategy = new HtmlSaveOptions.CssSavingStrategy(Strategy_4_CSS_MULTIPAGE_SAVING_RIGHT_WAY); options.CustomStrategyOfCssUrlCreation = new HtmlSaveOptions.CssUrlMakingStrategy(Strategy_5_CSS_MAKING_CUSTOM_URL_FOR_MULTIPAGING); // 4)進行轉換 pdfDocument.Save(htmlFile, options);
private static void Strategy_4_CSS_MULTIPAGE_SAVING_RIGHT_WAY(HtmlSaveOptions.CssSavingInfo partSavingInfo) { string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat(); string outPath = dataDir + "style_xyz_page" + partSavingInfo.CssNumber.ToString() + ".css"; System.IO.BinaryReader reader = new BinaryReader(partSavingInfo.ContentStream); System.IO.File.WriteAllBytes(outPath, reader.ReadBytes((int)partSavingInfo.ContentStream.Length)); } private static string Strategy_5_CSS_MAKING_CUSTOM_URL_FOR_MULTIPAGING(HtmlSaveOptions.CssUrlRequestInfo requestInfo) { return "/document-viewer/GetCss?cssId=4544554445_page{0}"; }
還想要更多嗎?您可以點擊閱讀【2019 · Aspose最新資源整合】,查找需要的教程資源。如果您有任何疑問或需求,請隨時加入Aspose技術交流群(642018183),我們很高興為您提供查詢和咨詢。
如果您對Aspose有任何需求和疑難,記得掃描下方二維碼告訴我們哦~
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn