Python 3 Office文档格式转换
- 2019 年 10 月 7 日
- 筆記
上次讲到,要快速提取word与excel文件中的图片,有一个前提条件,那就是操作的目标文件扩展名必须是要为.docx.xlsx才可以。这次我们用Python 3来实现.doc.xls文件自动转换为.docx.xlsx。
Python 3实现代码
import win32com.client as win32 # 引入win32com库(win32com功能强大,可以操作word、调用宏等等等)import os # 引入os库(文件及目录操作) #自定义xls转xlsx功能函数def xls_xlsx(fname): excel = win32.gencache.EnsureDispatch('Excel.Application') xls = excel.Workbooks.Open(fname) # 目标路径下的文件 xls.SaveAs(fname+'x', FileFormat = 51) #51为xlsx 56为xls xls.Close() #关闭资源 excel.Application.Quit() #退出Excel os.remove(fname) #删除原Excel文件 #自定义doc转docx功能函数def doc_docx(fname): word = win32.Dispatch('Word.Application') doc = word.Documents.Open(fname) # 目标路径下的文件 doc.SaveAs(fname+'x', 16) # 16为xlsx文件格式 doc.Close() #关闭资源 word.Quit() #退出word os.remove(fname) #删除原Word文件 if __name__=="__main__": #主程序入口 xls_xlsx('xxxxxx.xls') #调用xlsx转换函数 doc_docx('xxxxxx.doc') #调用docx转换函
以上是功能实现的Pyhton 3源代码,感兴趣的小伙伴可以自己动手尝试一下。