C# 將PDF轉為Excel

通常,PDF格式的文檔能支援的編輯功能不如office文檔多,針對PDF文檔裡面有表格數據的,如果想要編輯表格裡面的數據,可以將該PDF文檔轉為Excel格式,然後編輯。本文,將以C#程式碼為例,介紹如何實現由PDF格式到Excel文檔格式的轉換。下面是具體步驟。

【dll引用方法】

方法1

在程式中引入Spire.Pdf.dll文件;將 Spire.PDF for .NET 下載到本地,解壓,安裝。安裝完成後,找到安裝路徑下BIN文件夾中的Spire.Pdf.dll。然後在Visual Studio中打開「解決方案資源管理器」,滑鼠右鍵點擊「引用」,「添加引用」,將本地路徑BIN文件夾下的dll文件添加引用至程式。

方法2

通過 NuGet 安裝。可通過以下2種方法安裝:

1.可以在Visual Studio中打開「解決方案資源管理器」,滑鼠右鍵點擊「引用」,「管理NuGet包」,然後搜索「Spire.PDF」,點擊「安裝」。等待程式安裝完成。

  2.將以下內容複製到PM控制台安裝:Install-Package Spire.PDF -Version 8.3.9

【PDF轉Excel】

轉換時,可通過以下步驟來實現,僅需要三行程式碼:

  • 創建PdfDocument類的對象。
  • 調用PdfDocument.LoadFromFile(string filename)方法載入PDF文檔。
  • 通過PdfDocument.SaveToFile(string filename, FileFormat fileFormat)方法將文件保存為Excel格式到指定路徑。

C#

using Spire.Pdf;

namespace PDFtoExcel
{
    class Program
    {
        static void Main(string[] args)
        {
            //載入PDF文檔
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("test.pdf");

            //保存為Excel文檔
            pdf.SaveToFile("ToExcel.xlsx",FileFormat.XLSX);
        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace PDFtoExcel
    Class Program
        Private Shared Sub Main(args As String())
            '載入PDF文檔
            Dim pdf As New PdfDocument()
            pdf.LoadFromFile("test.pdf")

            '保存為Excel文檔
            pdf.SaveToFile("ToExcel.xlsx", FileFormat.XLSX)
        End Sub
    End Class
End Namespace

用於轉換的PDF文檔,包含9頁內容:

轉換時,是將原有PDF每頁單獨轉換為一個sheet頁,如圖,轉換後的Excel文檔包含9個sheet頁:

 

  —END—