python openyxl 表格 另存为 python 存excel_大数据

英文 | https://python.plainenglish.io/how-to-read-and-write-excel-files-in-python-3da9825e4955

使用 Python 读取其他文件格式,我们也可以使用 openpyxl 读取 Excel 文件。Openpxyl 正式用于编写、读取和更新 excel 文件。我们还将研究如何像 Excel 宏一样使用 openpyxl 制作机器人。

在本文中,我们将遍历 openpyxl 模块的所有类,学习读写 excel 文件以及修改现有的 excel 文件。

首先,如果您已经安装了最新版本的 Python,请使用以下命令安装 openpyxl。

pip install openpyxl

读取Excel文件:

要从excel文件中读取数据,首先,我们需要导入模块并设置openpyxl的读取格式。检查以下代码以读取文件数据设置。

#import libraries 
from openpyxl import load_workbook


wb = load_workbook("Excel.xlsx")
sheet = wb.active

从上面的代码示例中,我们已经看到 openpyxl 的 load_workbook 类采用 Excel 文件名参数,接下来,我们将读取 Excel 文件上的工作表。

正如我们所知,Excel 文件可以有无限的工作表,您可以选择当前活动的工作表,但如果您有多个工作表,则可以使用以下格式选择特定的工作表来读取数据。

#import libraries 
from openpyxl import load_workbook
#Selecting specific sheet
wb = load_workbook("Excel.xlsx")
sheet = wb.worksheets[0] # 0 1 2 3 or any

现在我们已经在 openpyxl 类中加载了我们的 Excel 文件,是时候从中读取数据了。我们在 openpyxl 中有两种类型的数据读取。

  • 单元格读数
  • 列读

单元格数据读取:

让我们以下面的 Excel 数据为例。假设您有一个包含 3 个标题名称、年龄和薪水的 excel,格式如下。我们的任务是读取第一列的第一个和最后一个单元格。

Name      age    salary
Haider    21     $56,000 
John      24     $36,000 
Jim       20     $26,000 
Sam       26     $76,000 
Willaim   22     $46,000
#import libraries 
from openpyxl import load_workbook


wb = load_workbook("excel.xlsx")
sheet = wb.active


#reading cell
print("First cell: ", sheet['A1'].value)
print("Second cell: ", sheet['A6'].value)

因此,我们使用我们创建的工作表变量/对象并将活动工作表数据存储在其中。

openpyxl 以列表形式存储每一列的数据。

好吧,根据 Python 列表语法,我们可以使用方括号 [] 来迭代列表。

然后我们以String的形式输入单元格位置。这里我们需要第一个和最后一个单元格。Excel 将它们命名为按字母顺序排列的列,并且 openpyxl 也可以在 Alphabet 中输入。

A1 表示第一个单元格表示列 A 和行号 1,然后 A6 表示最后一列。列 A 和行号 6。

输出:

First cell:  Name
Second cell:  Willaim

惊人的!我们还可以使用 range 方法一次读取多个单元格。查看以下代码。

#reading multiple cell
cells = sheet['A2':'C2']


for c1, c2, c3 in cells:
    print(c1.value, c2.value, c3.value)

好吧,我们不得不使用 range 方法告诉 openpyxl 我们想要来自 A2 → C2 列和第 2 行的数据。

它将以元组的形式存储第 3 列的行数据并访问该元组,我们将进行迭代 它使用for循环。我们在元组中有 3 个元素,因此我们将每个数据存储在不同的变量中,就像我们在 for 循环中所做的那样。接下来,使用 value 方法我们可以访问它们存储的位置值。

Sheet.cell()

我们还有另一种惊人的方式来使用 sheet.cell 方法读取 Excel 文件的特定单元格。检查以下代码以了解此方法的工作原理。

#import libraries 
from openpyxl import load_workbook


wb = load_workbook("excel.xlsx")
sheet = wb.active


#reading specific column 
cell1 = sheet.cell(row = 1, column = 1).value
cell2 = sheet.cell(row = 1, column = 2).value
cell3 = sheet.cell(row = 1, column = 3).value


print(cell1, cell2 ,cell3)

我们可以注意到 sheet.cell() 方法接受 2 个参数——行和列——最后,我们使用 .value 方法将地址数据转换为字符串格式数据。

列数据读取:

我们可以使用 openpyxl 模块读取 Excel 文件中的特定或所有列。

要读取特定列,只需使用我们在单元格读取部分中看到的方法,而不是使用字母表给出行单元格编号,只需键入列字母表。

检查下面的代码以获得更好的理解。

#import libraries 
from openpyxl import load_workbook


wb = load_workbook("excel.xlsx")
sheet = wb.active


#reading specific column 
cell1 = sheet.cell(row = 1, column = 1).value
cell2 = sheet.cell(row = 1, column = 2).value
cell3 = sheet.cell(row = 1, column = 3).value


print(cell1, cell2 ,cell3)

您需要做的另一件事是迭代列的数据。正如我们已经知道的,openpyxl 给出了特定单元格的位置。

这意味着我们将数据的所有位置存储在 A 列中,并使用 for 循环,我们可以转到 A 列中的每个单元格并打印它们的数据。查看此代码的输出。

输出:

Name
Haider
John
Jim
Sam
Willaim

编写 Excel 文件:

要编写 Excel 文件,我们必须遵循相同的 openpyxl 代码语法,但有一些细微差别。假设我们有一个空的 Excel 文件,我们想将数据写入其中。我们可以用两种形式在Excel中写入数据:

  • 单元格写入
  • 行列书写

两者都是相同的,但它们的工作方式不同。我们将通过它们两个,看看它们是如何实际工作的。

单元格写入

单元格写入与读取单元格相同。但是会添加一个小的修改。检查下面的代码。

#import libraries 
from openpyxl import load_workbook


wb = load_workbook("excel.xlsx")
sheet = wb.active


#reading specific column 
columns = sheet["A1"].value="Name"
columns = sheet["B1"].value="Age"
columns = sheet["C1"].value="Salary"


wb.save("excel.xlsx")

我们没有读取数据,而是将 sheet[“A1”] 修改为 sheet[“A”].value=”Name”。所以 openpyxl 有一个类的组合,每个类都有它的对象。

所以我们调用对象值并给它字符串。我对 B1 和 C1 细胞做了同样的处理。最后,我们必须保存我们的工作簿,所以,我使用了保存方法并将其命名为 excel.xlsx,这与开始时的 excel 文件相同。如果您运行代码,您将获得以下输出。

python openyxl 表格 另存为 python 存excel_编程语言_02

对了,您可以自己测试一下,了解更多关于 openpyxl 中单元格编写的信息。让我们继续行列写作。

行列书写

行列书写。通过它的名字,您将了解到底发生了什么。我们将使用行号和列号编写单元格,当您想在不同列的不同行中写入大量数据时,它会派上用场。我们以上面的例子,尝试用行列写法在excel中重新写一遍。

#import libraries 
from openpyxl import load_workbook


wb = load_workbook("excel.xlsx")
sheet = wb.active


#reading specific column 
sheet.cell(row=1, column=1).value="Name"
sheet.cell(row=1, column=2).value="Age"
sheet.cell(row=1, column=3).value="Salary"


wb.save("excel.xlsx")

嗯,是的!你是对的。

我们必须使用另一种读取方法通过调用其值对象来写入 Excel。如果您看到了,我们已经通过调用 value 对象,为其分配一个字符串,并使用 wb.save() 方法保存更改来完成相同的操作。如果我们运行代码,我们会得到与上面相同的输出。

让我们尝试一个不同的场景。假设我们有两个列表名称和薪水,并且我们想在 excel 中编写它。

我们将使用行列写法,检查下面的代码。

#import libraries 
from openpyxl import load_workbook


wb = load_workbook("excel.xlsx")
sheet = wb.worksheets[0]


name=["John", "Dennis", "Ferb", "Candas", "Tadashi"]
salary=["$45000","$78000","$34000","$71000","$98000"]


sheet.cell(row=1, column=1).value="Name"
sheet.cell(row=1, column=2).value="Salary"


j=2
for i in range(0,5):
    sheet.cell(row=j, column=1).value=name[i]
    sheet.cell(row=j, column=2).value=salary[i]
    j+=1


wb.save("excel.xlsx")

首先,我们必须编写 Excel 文件的标题。因此,一开始,我们对标题的行和列进行了硬编码,接下来,我们迭代名称和工资中的元素。我们知道每一列的第一行是为标题保留的。所以,我们从第二行开始写。如果我们运行此代码,我们将在 Excel 中得到以下输出。

python openyxl 表格 另存为 python 存excel_大数据_03

总结

到目前为止,我们学习了如何使用不同的 openpyxl 读取方法来读取 Excel 文件,还学习了编写 Excel 文件。您可以了解有关 openpyxl 函数的更多信息,用于修改 Python 脚本并使您的 Python 脚本更准确,以便编写和读取 Excel 文件。或者查看官方文档。

最后,感谢您的阅读,希望您觉得这篇文章对您有帮助。