使用 openpyxl 批量取消「合併單元格」並自動填充值
我們在進行數據處理的時候,數據源通常是 Excel 文件。
當數據量非常大時,對數據格式進行轉換,要求數據格式盡量整齊。下面展示的數據格式就不能算是整齊。
如果表格中存在合併單元格,那麼會出現空值的情況,這很不方便。手動操作 Excel 去取消合併單元格,步驟不僅繁瑣、容易出錯,而且如果文件內容非常多,這樣重複的操作無疑是一種折磨。
如果想要整理成這樣的數據,該怎麼做呢?
這裡給出一個腳本,使用 openpyxl 批量取消「合併單元格」並自動填充值。
"""
`openpyxl` 取消 `Excel` 表格的**合併單元格**,並自動填充數據
"""
from openpyxl import load_workbook
# 1. 加載數據
work_book = load_workbook(filename="data2.xlsx", read_only=False)
sheet = work_book["Sheet1"]
# 2. 找出所有的合併單元格的索引信息
mc_range_list = [str(item) for item in sheet.merged_cells.ranges]
# 3. 批量取消合併單元格,填充數據
for mc_range in mc_range_list:
# 取得左上角值的坐標
top_left, bot_right = mc_range.split(":") # ["A1", "A12"]
top_left_col, top_left_row = sheet[top_left].column, sheet[top_left].row # (1, 1,)
bot_right_col, bot_right_row = sheet[bot_right].column, sheet[bot_right].row # (1, 12,)
# 記下該合併單元格的值
cell_value = sheet[top_left].value # 忍者
# 取消合併單元格
sheet.unmerge_cells(mc_range)
# 批量給子單元格賦值
# 遍歷列
for col_idx in range(top_left_col, bot_right_col+1):
# 遍歷行
for row_idx in range(top_left_row+1, bot_right_row+1):
sheet[f"{chr(col_idx+64)}{row_idx}"] = cell_value
# 4. 保存更改
work_book.save("data3.xlsx")