文檔金喜正規買球>>E-iceblue中文文檔>>將 HTML 轉換為 XML
將 HTML 轉換為 XML
Office Open 成為在 Web 上交付結構化數據的首選技術,與 HTML 攜手并進并完全補充 HTML。因此,我們需要在工作的某個時間點將 HTML 轉換為 Office OpenXML。本文主要通過一個專業的Word .NET 庫Spire.Doc來講述轉換過程。
這篇文章仍然專注于將word從/到HTML,而主要是關于在word文檔和HTML中嵌入圖像的支持。隨著Spire.Doc的改進(從Spire.Doc V. 4.9.32開始),現在它支持ImageEmbedded的新功能。
首先我們需要完成程序前的準備工作:
- 下載 Spire.Doc并將其安裝在您的機器上。
- 添加 Spire.Doc.dll 文件作為參考。
- 打開bin文件夾,選擇.NET 4.0下的三個dll文件。
- 右鍵單擊屬性并在其菜單中選擇屬性。
- 將目標框架設置為 .NET 4。
-
添加 Spire.Doc 作為命名空間。
以下步驟將向您展示如何輕松做到這一點:
第 1 步:創建一個 Word 文檔。[C#]
Document doc = new Document();
第 2 步:加載 HTML 文件。
[C#]
doc.LoadFromFile("Sample.html");
第 3 步:將 HTML 保存為 XML 文件。
[C#]
doc.SaveToFile("test.xml", FileFormat.Xml);
這是完整的 C# 和 VB.NET 代碼
[C#]
using Spire.Doc; namespace HTMLXML { class Program { static void Main(string[] args) { Document doc = new Document(); doc.LoadFromFile("Sample.html"); doc.SaveToFile("test.xml", FileFormat.Xml); } } }
[VB.NET]
Imports Spire.Doc Namespace HTMLXML Class Program Private Shared Sub Main(args As String()) Dim doc As New Document() doc.LoadFromFile("Sample.html") doc.SaveToFile("test.xml", FileFormat.Xml) End Sub End Class End Namespace
原始 HTML 文件的預覽。
生成的 Office OpenXML 文件的預覽。