Python工具开发实践-csv2excel

2019 年 12 月 26 日
筆記

Python学习有一段时间了，今天来尝试编写一个程序来实现csv文件转换为excel文件的功能。

首先分析需求，将需求分解为如下几个步骤：

1、获取文件名称；

2、打开csv，可以使用pandas；

3、保存为excel，可以使用pandas

4、可以对程序处理时间进行计时，会用到time模块

对于第一个步骤，如果直接告诉程序文件的名称的话，程序的可移植性太差了，不够灵活，每次都要修改程序，不如升华一下，告诉程序一个目录，程序自动获取目录下的所有csv文件，这样就方便多了。

修改需求如下：

1、告知一个目录，程序自动获取目录下所有的csv文件名称，会用到os模块；

2、打开csv，可以使用pandas；

3、保存为excel，可以使用pandas

4、可以对程序处理时间进行计时，会用到time模块

每一个小功能可以编写成一个函数，然后在主函数main里调用。

第一个函数：

def get_allfile():    """    获取文件夹下所有csv文件    """    # 用户交互界面，提示用户输出    path = input('Please input your file path: ')    # 列出当前目录下的所有文件，返回一个列表    files = os.listdir(path)    # 初始化一个空列表，用来存储csv文件列表    file_list = []    for f in files:        # 遍历文件列表中的文件，判断是否为csv文件        if os.path.splitext(f)[1] == '.csv':            # 如果是，则将文件的绝对目录放到csv文件列表中，否则跳过            file_list.append(path + '\' + f)        else:            pass    # 返回csv文件列表    return file_list

第二个和第三个功能都用pandas，可以放到一个函数：

def csv2excel(f):    """    打开csv,另存为excel文件    """    # 打开csv    df = pd.DataFrame(pd.read_csv(f, header=0, encoding='gbk'))    # 另存为excel，文件绝对目录+csv文件名称+后缀.xlsx，去掉索引列    df.to_excel(os.path.splitext(os.path.dirname(f) + '\'                                 + os.path.basename(f))[0] + '.xlsx', index=None)

用time模块计时比较简单，放到主函数main()就好了

def main():    # 获取文件列表    file_list = get_allfile()    # 计时开始    start_time = time.time()    # csv转excel处理    for file in file_list:        csv2excel(file)    # 计时结束    end_time = time.time()    # 计算程序处理耗时    cost_time = end_time - start_time    # 用户交互界面，输出运行时间，并保留2为小数    print('程序运行时间：{}秒'.format(float('%.2f' % cost_time)))    # 为防止程序运行完自动跳出，将页面保留60秒    time.sleep(60)

至此，各个函数都写好了，将各个函数放到一个py文件就可以了，记着首先要导入使用到的模块

import pandas as pdimport osimport time

另外，下面的最关键的两行

if __name__ == '__main__':    main()

Python工具开发实践-csv2excel

VirMach 便宜 VPS

QNews

Python工具开发实践-csv2excel

分享此文：

Related Posts

mysql主从不同步处理过程分享

Oracle 回滚段undo

Python进阶：丢失的一笔订单

Python工具开发实践-csv文件分割

VirMach 便宜 VPS

QNews

熱門搜尋