Python 3 Office文檔格式轉換

  • 2019 年 10 月 7 日
  • 筆記

上次講到,要快速提取word與excel文件中的圖片,有一個前提條件,那就是操作的目標文件擴展名必須是要為.docx.xlsx才可以。這次我們用Python 3來實現.doc.xls文件自動轉換為.docx.xlsx。

Python 3實現程式碼

import win32com.client as win32  # 引入win32com庫(win32com功能強大,可以操作word、調用宏等等等)import os                        # 引入os庫(文件及目錄操作)  #自定義xls轉xlsx功能函數def xls_xlsx(fname):    excel = win32.gencache.EnsureDispatch('Excel.Application')    xls = excel.Workbooks.Open(fname)       # 目標路徑下的文件    xls.SaveAs(fname+'x', FileFormat = 51)    #51為xlsx 56為xls    xls.Close()                             #關閉資源    excel.Application.Quit()                #退出Excel    os.remove(fname)                        #刪除原Excel文件 #自定義doc轉docx功能函數def doc_docx(fname):    word = win32.Dispatch('Word.Application')    doc = word.Documents.Open(fname)  # 目標路徑下的文件    doc.SaveAs(fname+'x', 16)  # 16為xlsx文件格式    doc.Close()                 #關閉資源    word.Quit()                 #退出word    os.remove(fname)           #刪除原Word文件  if __name__=="__main__":        #主程式入口    xls_xlsx('xxxxxx.xls')    #調用xlsx轉換函數    doc_docx('xxxxxx.doc')    #調用docx轉換函

以上是功能實現的Pyhton 3源程式碼,感興趣的小夥伴可以自己動手嘗試一下。