本文主要介绍了python使用openpyxl读取合并单元格的值,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

问题

  • 假设在test.xlsx的“Sheet1”工作表中,A1:D3区域的值如下:

注意此处1、7、8都是合并单元格,其中7还是横向的,能将这些吊单元格统一处理的思路才是本篇文章的重点

  • 要求给定指定的行、列以及对应的工作表作为参数,能够正确解析合并单元格,获取指定单元格的值。

目的是合并单元格内的所有占位单元格也都能获取到对应的合并数据

  • 如果直接根据行列获取对应单元格的值,则合并单元格非左上角的其他单元格都会获取到None值,如下:
if __name__ == "__main__":
      wb = xl.load_workbook("test.xlsx")
      sheet_ = wb["Sheet1"]
      print(sheet_["A1"].value)  # 1
      print(sheet_["A2"].value)  # None
      print(sheet_["D1"].value)  # 8
      print(sheet_["D2"].value)  # None
      print(sheet_["D3"].value)  # None

解决思路

  • 获取到对应单元格后,判断该单元格是否为合并单元格,如果是,则找到该合并区域并获取左上角的值返回。
  • 通过 sheet.merged_cell_ranges属性,可以获取当前工作表所有的合并区域列表:
  • 测试代码:
if __name__ == "__main__":
      wb = xl.load_workbook("test.xlsx")
      sheet_ = wb["Sheet1"]
      merged_ranges = sheet_.merged_cell_ranges  # 获取当前工作表的所有合并区域列表
      for merged_range in merged_ranges:
          print(type(merged_range))  # 打印区域对象类型
          print(merged_range)  # 打印区域
  • 结果如下:
  • 我们巡着openpyxl.worksheet.merge.MergedCellRange查找其源码,发现定义了in操作,可以直接通过in确认某个坐标是否位于区域内
  • 这时候我们已经基本具备获取合并单元格的条件了。
  • 完整代码如下:
import openpyxl as xl
  from openpyxl.worksheet.worksheet import Worksheet
  from openpyxl.cell import MergedCell
   
   
  def parser_merged_cell(sheet: Worksheet, row, col):
      """
      检查是否为合并单元格并获取对应行列单元格的值。
      如果是合并单元格,则取合并区域左上角单元格的值作为当前单元格的值,否则直接返回该单元格的值
      :param sheet: 当前工作表对象
      :param row: 需要获取的单元格所在行
      :param col: 需要获取的单元格所在列
      :return: 
      """
      cell = sheet.cell(row=row, column=col)
      if isinstance(cell, MergedCell):  # 判断该单元格是否为合并单元格
          for merged_range in sheet.merged_cell_ranges:  # 循环查找该单元格所属的合并区域
              if cell.coordinate in merged_range:
                  # 获取合并区域左上角的单元格作为该单元格的值返回
                  cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col)
                  break
      return cell
   
   
  if __name__ == "__main__":
      wb = xl.load_workbook("test.xlsx")
      sheet_ = wb["Sheet1"]
   
      for row_index in range(1, 4):
          for col_index in range(1, 5):
              cell_ = parser_merged_cell(sheet_, row_index, col_index)
              print("第%s行第%s列:%s" % (row_index, col_index, cell_.value))
  • 结果如下:
第1行第1列:1
  第1行第2列:2
  第1行第3列:3
  第1行第4列:8
  第2行第1列:1
  第2行第2列:4
  第2行第3列:5
  第2行第4列:8
  第3行第1列:6
  第3行第2列:7
  第3行第3列:7
  第3行第4列:8