翻譯|使用教程|編輯:李顯亮|2020-01-19 13:42:16.797|閱讀 1755 次
概述:在某些情況下,可能希望將PDF文檔轉換為可編輯的文檔格式。為了使轉換過程自動化,本文將展示如何在Java中以編程方式將PDF轉換為Word。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
PDF是將文檔發送給第三方的最常用格式之一。造成這種流行的原因是PDF跨多個平臺的兼容性,而不考慮任何硬件/軟件要求。但是,在某些情況下,可能希望將PDF文檔轉換為可編輯的文檔格式。
在這種情況下, PDF到Word DOC或DOCX可能是優先級轉換選項。為了使轉換過程自動化,本文將展示如何在Java中以編程方式將PDF轉換為Word。如果你還沒有升級Aspose.PDF最新版測試,可以點擊這里下載。
在本文中,我們將使用Aspose.PDF在Java中執行以下PDF到DOC/DOCX的轉換:
在應用程序中引用了Java的Aspose.PDF之后,可以通過幾行代碼將任何PDF文檔轉換為DOC格式。以下是執行此轉換所需的步驟。
以下代碼示例顯示了如何在Java中將PDF轉換為DOC。
// Load source PDF file Document doc = new Document("input.pdf"); // Save resultant DOC file doc.save("output.doc", SaveFormat.Doc);
輸入的PDF文件
轉換后的Excel文檔
DOCX是Word文檔的一種眾所周知的格式,與DOC格式相反,DOCX的結構基于二進制文件和XML文件。如果要將PDF轉換為DOCX格式,可以使用Document.save()方法中的SaveFormat.DocX參數告訴API這樣做。
以下代碼示例顯示了如何在Java中將PDF轉換為DOCX。
// Load source PDF file Document doc = new Document("input.pdf"); // Save resultant DOCX file doc.save("output.docx", SaveFormat.DocX);
Aspose.PDF for Java還提供了一些其他選項,可以在PDF到Word的轉換中使用這些選項,例如輸出格式,圖像分辨率,文本行之間的距離等。DocSaveOptions類用于此目的,以下是您可以使用的選項列表:
下面的代碼示例演示如何使用Java將PDF中的DocSaveOptions類轉換為DOCX。
// Load source PDF file Document doc = new Document("input.pdf"); // Instantiate DocSaveOptions instance DocSaveOptions saveOptions = new DocSaveOptions(); // Set output format saveOptions.setFormat(DocSaveOptions.DocFormat.DocX); // Set the recognition mode as Flow saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow); // Set the horizontal proximity as 2.5 saveOptions.setRelativeHorizontalProximity(2.5f); // Enable bullets recognition during conversion process saveOptions.setRecognizeBullets(true); // Save resultant DOCX file doc.save("resultant.docx", saveOptions);
金喜正規買球相關的文章推薦:【開年特獻!使用Aspose.Words在.NET中以編程方式將Word格式轉換為PDF完整指南】
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn