Python工具开发实践-csv2excel

  • 2019 年 12 月 26 日
  • 筆記

Python学习有一段时间了,今天来尝试编写一个程序来实现csv文件转换为excel文件的功能。

首先分析需求,将需求分解为如下几个步骤:

1、获取文件名称;

2、打开csv,可以使用pandas;

3、保存为excel,可以使用pandas

4、可以对程序处理时间进行计时,会用到time模块

对于第一个步骤,如果直接告诉程序文件的名称的话,程序的可移植性太差了,不够灵活,每次都要修改程序,不如升华一下,告诉程序一个目录,程序自动获取目录下的所有csv文件,这样就方便多了。

修改需求如下:

1、告知一个目录,程序自动获取目录下所有的csv文件名称,会用到os模块;

2、打开csv,可以使用pandas;

3、保存为excel,可以使用pandas

4、可以对程序处理时间进行计时,会用到time模块

每一个小功能可以编写成一个函数,然后在主函数main里调用。

第一个函数:

def get_allfile():    """    获取文件夹下所有csv文件    """    # 用户交互界面,提示用户输出    path = input('Please input your file path: ')    # 列出当前目录下的所有文件,返回一个列表    files = os.listdir(path)    # 初始化一个空列表,用来存储csv文件列表    file_list = []    for f in files:        # 遍历文件列表中的文件,判断是否为csv文件        if os.path.splitext(f)[1] == '.csv':            # 如果是,则将文件的绝对目录放到csv文件列表中,否则跳过            file_list.append(path + '\' + f)        else:            pass    # 返回csv文件列表    return file_list

第二个和第三个功能都用pandas,可以放到一个函数:

def csv2excel(f):    """    打开csv,另存为excel文件    """    # 打开csv    df = pd.DataFrame(pd.read_csv(f, header=0, encoding='gbk'))    # 另存为excel,文件绝对目录+csv文件名称+后缀.xlsx,去掉索引列    df.to_excel(os.path.splitext(os.path.dirname(f) + '\'                                 + os.path.basename(f))[0] + '.xlsx', index=None)

用time模块计时比较简单,放到主函数main()就好了

def main():    # 获取文件列表    file_list = get_allfile()    # 计时开始    start_time = time.time()    # csv转excel处理    for file in file_list:        csv2excel(file)    # 计时结束    end_time = time.time()    # 计算程序处理耗时    cost_time = end_time - start_time    # 用户交互界面,输出运行时间,并保留2为小数    print('程序运行时间:{}秒'.format(float('%.2f' % cost_time)))    # 为防止程序运行完自动跳出,将页面保留60秒    time.sleep(60)

至此,各个函数都写好了,将各个函数放到一个py文件就可以了,记着首先要导入使用到的模块

import pandas as pdimport osimport time

另外,下面的最关键的两行

if __name__ == '__main__':    main()