Python工具开发实践-csv2excel
- 2019 年 12 月 26 日
- 筆記
Python学习有一段时间了,今天来尝试编写一个程序来实现csv文件转换为excel文件的功能。
首先分析需求,将需求分解为如下几个步骤:
1、获取文件名称;
2、打开csv,可以使用pandas;
3、保存为excel,可以使用pandas
4、可以对程序处理时间进行计时,会用到time模块
对于第一个步骤,如果直接告诉程序文件的名称的话,程序的可移植性太差了,不够灵活,每次都要修改程序,不如升华一下,告诉程序一个目录,程序自动获取目录下的所有csv文件,这样就方便多了。
修改需求如下:
1、告知一个目录,程序自动获取目录下所有的csv文件名称,会用到os模块;
2、打开csv,可以使用pandas;
3、保存为excel,可以使用pandas
4、可以对程序处理时间进行计时,会用到time模块
每一个小功能可以编写成一个函数,然后在主函数main里调用。
第一个函数:
def get_allfile(): """ 获取文件夹下所有csv文件 """ # 用户交互界面,提示用户输出 path = input('Please input your file path: ') # 列出当前目录下的所有文件,返回一个列表 files = os.listdir(path) # 初始化一个空列表,用来存储csv文件列表 file_list = [] for f in files: # 遍历文件列表中的文件,判断是否为csv文件 if os.path.splitext(f)[1] == '.csv': # 如果是,则将文件的绝对目录放到csv文件列表中,否则跳过 file_list.append(path + '\' + f) else: pass # 返回csv文件列表 return file_list
第二个和第三个功能都用pandas,可以放到一个函数:
def csv2excel(f): """ 打开csv,另存为excel文件 """ # 打开csv df = pd.DataFrame(pd.read_csv(f, header=0, encoding='gbk')) # 另存为excel,文件绝对目录+csv文件名称+后缀.xlsx,去掉索引列 df.to_excel(os.path.splitext(os.path.dirname(f) + '\' + os.path.basename(f))[0] + '.xlsx', index=None)
用time模块计时比较简单,放到主函数main()就好了
def main(): # 获取文件列表 file_list = get_allfile() # 计时开始 start_time = time.time() # csv转excel处理 for file in file_list: csv2excel(file) # 计时结束 end_time = time.time() # 计算程序处理耗时 cost_time = end_time - start_time # 用户交互界面,输出运行时间,并保留2为小数 print('程序运行时间:{}秒'.format(float('%.2f' % cost_time))) # 为防止程序运行完自动跳出,将页面保留60秒 time.sleep(60)
至此,各个函数都写好了,将各个函数放到一个py文件就可以了,记着首先要导入使用到的模块
import pandas as pdimport osimport time
另外,下面的最关键的两行
if __name__ == '__main__': main()

