原计划写一个openpyxl的操作文档,普及下python如何来操作excel,结果人家官方的文档已经写的非常完美了,就临时改主意把人家的文档翻译了一遍。可以阅读英文文档的同学,建议大家直接去看官方的API操作文档

官网地址:Openpyxl

创建一个excel文件

使用openpyxl模块工作时,我们并需要在系统文件中创建一个excel文件。只需要导入Workbook类就可以了:

>>> from openpyxl import Workbook
>>> wb = Workbook()


一个excel文件总是会自动创建至少一张表,也就是所谓的sheet

你可以通过使用命令Workbook对象名.active来获取这张sheet

>>> ws = wb.active


注意:active默认获取下标0的表。除非你自行指定了下标,否则你将永远都只能获取到第一张表。

你可以使用命令Workbook对象.create_sheet()来创建sheet表单:

>>> ws1 = wb.create_sheet("Mysheet") # insert at the end (default)
# or
>>> ws2 = wb.create_sheet("Mysheet", 0) # insert at first position
# or
>>> ws3 = wb.create_sheet("Mysheet", -1) # insert at the penultimate position



自行创建的sheet表单都会自动的生成一个名字。类似与sheet、sheet1、sheet2…你随时都可以修改这个名字,只要通过属性title:

wb.title = ‘new title’



默认情况下,改标题表单下的表格是白色的。你可以通过属性:表单对象.sheet_properties.tabColor来设置

ws.sheet_properties.tabColor = "1072BA"



一旦你定义了sheet表单的标题之后,你就可以将其作为workbook对象的key来进行调用:

>>> ws3 = wb["New Title"]



通过sheetname属性你可以浏览workbook对象下所有sheet表单的标题

>>> print(wb.sheetnames)
['Sheet2', 'New Title', 'Sheet1']

你也可以循环遍历所有的sheet表单

>>> for sheet in wb:
...     print(sheet.title)



你可以在当前文件中,创建sheet表单的副本

>>> source = wb.active
>>> target = wb.copy_worksheet(source)



注意:
只有单元格(包括值、样式、超链接和注释)和某些表格工作属性(包括尺寸、格式和属性)。不能复制所有其他文件/表单的属性,比如:图像、图表
也不能在工作簿之间赋值sheet表。如果工作簿是只读或者只写的模式,那么你也不能赋值它。

操作数据

访问一个单元格

现在我们已经知道了如何取获取一个sheet表单,现在可以开始修改表单中单元格的内容了。单元格可以作为表单的key来直接访问

>>> c = ws['A4']

上面命令将会返回A4单元格,如果A4不存在的话,那命令执行完成之后会自动创建一个。可以直接进行赋值操作

>>> ws['A4'] = 4

openpyxl也提供了cell()函数。

这个函数可以通过行和列更精确的访问单元格

>>> d = ws.cell(row=4, column=2, value=10)


 

注意:

内存中的sheet表不存在任何的单元格。所有你操作的单元格都是在访问的同时创建的正是由于此特性,所以即使你没有给他们分配值,也可以通过滚动的浏览的方式在内存中创建单元格

类似于下列方法

>>> for x in range(1,101):
...        for y in range(1,101):
...            ws.cell(row=x, column=y)

这个代码块将会创建一个100*100的单元格,但没有什么实际意义

访问多个单元格

可以通过切片来访问多个单元格

>>> cell_range = ws['A1':'C2']

也可以使用类似的方法来获取行或者列的范围

>>> colC = ws['C']
>>> col_range = ws['C:D']
>>> row10 = ws[10]
>>> row_range = ws[5:10]

你也可以使用iter_row()方法:

>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
...    for cell in row:
...        print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.B1>
<Cell Sheet1.C1>
<Cell Sheet1.A2>
<Cell Sheet1.B2>
<Cell Sheet1.C2>

同样使用iter_cols()方法可以返回列:

>>> for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):
...     for cell in col:
...         print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.A2>
<Cell Sheet1.B1>
<Cell Sheet1.B2>
<Cell Sheet1.C1>
<Cell Sheet1.C2>

注意:

出于性能原因,Worksheet.iter_cols()方法在只读模式下不可用。

如果你需要遍历所有的行或者列的话,你可以使用row属性或者columns属性

>>> ws = wb.active
>>> ws['C9'] = 'hello world'
>>> tuple(ws.rows)
((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>),
(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>),
(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>),
(<Cell Sheet.A4>, <Cell Sheet.B4>, <Cell Sheet.C4>),
(<Cell Sheet.A5>, <Cell Sheet.B5>, <Cell Sheet.C5>),
(<Cell Sheet.A6>, <Cell Sheet.B6>, <Cell Sheet.C6>),
(<Cell Sheet.A7>, <Cell Sheet.B7>, <Cell Sheet.C7>),
(<Cell Sheet.A8>, <Cell Sheet.B8>, <Cell Sheet.C8>),
(<Cell Sheet.A9>, <Cell Sheet.B9>, <Cell Sheet.C9>))>>> tuple(ws.columns)
((<Cell Sheet.A1>,
<Cell Sheet.A2>,
<Cell Sheet.A3>,
<Cell Sheet.A4>,
<Cell Sheet.A5>,
<Cell Sheet.A6>,
...
<Cell Sheet.B7>,
<Cell Sheet.B8>,
<Cell Sheet.B9>),
(<Cell Sheet.C1>,
<Cell Sheet.C2>,
<Cell Sheet.C3>,
<Cell Sheet.C4>,
<Cell Sheet.C5>,
<Cell Sheet.C6>,
<Cell Sheet.C7>,
<Cell Sheet.C8>,
<Cell Sheet.C9>))

 

注意:

处于性能原因的考虑,columns属性在只读模式下不可以用

仅获取单元格的值

如果你只是想获取sheet表单中的值的话,可以使用属性valus。这将遍历工作表中所有的行,但仅返回单元格的值

for row in ws.values:
   for value in row:
     print(value)


 iter_rows()和iter_cols()函数通过参数 values_only也都可以之返回值

>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True):
...   print(row)

(None, None, None)


(None, None, None)

数据存储

一旦我们有了一个单元格之后,我们可以指定它的值

>>> c.value = 'hello, world'
>>> print(c.value)
'hello, world'

>>> d.value = 3.14
>>> print(d.value)3.14

保存到文件

最简单以及最安全的用来保存workbook的方法,是通过使用workbook类对象的save()方法

>>> wb = Workbook()
>>> wb.save('balances.xlsx')



注意:
此操作将会重写已存在的文件内容,并且不会给出警告
文件名扩展名不是强制为xlsx或xlsm,如果你不使用官方扩展名,那你可能无法通过其他应用程序直接打开此文件。
由于OOXML文件基本上是ZIP文件,因此您也可以使用自己喜欢的ZIP存档管理器将其打开。

存储为流

如果你想将文件保存到流对象中,比如,在你使用一些像Pyramid、Flask或者Django这样的web框架时,你只需要通过一个NameTemporaryFile()对象

>>> from tempfile import NamedTemporaryFile
>>> from openpyxl import Workbook
>>> wb = Workbook()
>>> with NamedTemporaryFile() as tmp:
        wb.save(tmp.name)
        tmp.seek(0)
        stream = tmp.read()

你可以设置属性template=True,将workbook对象保存为一个模板

>>> wb = load_workbook('document.xlsx')
>>> wb.template = True
>>> wb.save('document_template.xltx')



或者将属性设置为False(默认值),将workbook对象保存为一个文件

>>> wb = load_workbook('document_template.xltx')
>>> wb.template = False
>>> wb.save('document.xlsx', as_template=False)



加载已有的文件
与创建文件相同,通过openpyxl.load_workbook()可以打开一个现有的文件

>>> from openpyxl import load_workbook
>>> wb2 = load_workbook('test.xlsx')
>>> print wb2.sheetnames
['Sheet2', 'New Title', 'Sheet1']