使用 openpyxl 批量取消「合併單元格」並自動填充值

我們在進行數據處理的時候,數據源通常是 Excel 文件。

當數據量非常大時,對數據格式進行轉換,要求數據格式盡量整齊。下面展示的數據格式就不能算是整齊。

image

如果表格中存在合併單元格,那麼會出現空值的情況,這很不方便。手動操作 Excel 去取消合併單元格,步驟不僅繁瑣、容易出錯,而且如果文件內容非常多,這樣重複的操作無疑是一種折磨。

如果想要整理成這樣的數據,該怎麼做呢?

image

這裡給出一個腳本,使用 openpyxl 批量取消「合併單元格」並自動填充值。

"""
`openpyxl` 取消 `Excel` 表格的**合併單元格**,並自動填充數據
"""

from openpyxl import load_workbook

# 1. 加載數據
work_book = load_workbook(filename="data2.xlsx", read_only=False)
sheet = work_book["Sheet1"]

# 2. 找出所有的合併單元格的索引信息
mc_range_list = [str(item) for item in sheet.merged_cells.ranges]

# 3. 批量取消合併單元格,填充數據
for mc_range in mc_range_list:
    # 取得左上角值的坐標
    top_left, bot_right = mc_range.split(":") # ["A1", "A12"]
    top_left_col, top_left_row = sheet[top_left].column, sheet[top_left].row # (1, 1,)
    bot_right_col, bot_right_row = sheet[bot_right].column, sheet[bot_right].row # (1, 12,)
    # 記下該合併單元格的值
    cell_value = sheet[top_left].value # 忍者
    # 取消合併單元格
    sheet.unmerge_cells(mc_range)
    # 批量給子單元格賦值
    # 遍歷列
    for col_idx in range(top_left_col, bot_right_col+1):
        # 遍歷行
        for row_idx in range(top_left_row+1, bot_right_row+1):
            sheet[f"{chr(col_idx+64)}{row_idx}"] = cell_value

# 4. 保存更改            
work_book.save("data3.xlsx")