本文概述

从CSV文件读取

csv代表逗号分隔值, 它定义为一种简单的文件格式, 使用特定的结构来排列表格数据。它以纯文本格式存储表格数据, 例如电子表格或数据库, 并具有通用的数据交换格式。将csv文件打开到excel文件中, 并且行和列数据定义标准格式。

将csv文件读入pandas DataFrame是快速而直接的。我们不需要编写几行代码来打开, 分析和读取Pandas中的csv文件。相反, 我们可以在一行中执行这些操作, 并将数据存储在DataFrame中。

为了读取Pandas文件, 首先我们必须将数据从文件格式加载到DataFrame中。你只需要一行即可在代码中加载数据。

Name, Hire Date, Salary, Leaves Remaining

John Idle, 08/15/14, 50000.00, 10

Smith Gilliam, 04/07/15, 65000.00, 6

Parker Chapman, 02/21/14, 45000.00, 7

Jones Palin, 10/14/13, 70000.00, 3

Terry Gilliam, 07/22/14, 48000.00, 9

Michael Palin, 06/28/13, 66000.00, 8

df = pd.read_csv('a.csv')

代码

import pandas

df = pandas.read_csv('hrdata.csv')

print(df)

在上面的代码中, 三行代码足以读取文件, 而其中只有一行正在执行实际工作, 即pandas.read_csv()。

输出

Name Hire Date Salary Leaves Remaining

0 John Idle 08/15/14 50000.0 10

1 Smith Gilliam 04/07/15 65000.0 8

2 Parker Chapman 02/21/14 45000.0 10

3 Jones Palin 10/14/13 70000.0 3

4 Terry Gilliam 07/22/14 48000.0 7

5 Michael Palin 06/28/13 66000.0 8

但是, Pandas在DataFrame中也使用从零开始的整数索引。我们没有告诉它我们的索引应该是什么。

从JSON读取

如果你有任何JSON文件, Pandas可以通过单行代码轻松读取它。

df =pd.read_json('hrdata.json')

它允许索引通过嵌套工作。

Pandas将列表列表转换为DataFrame, 还分别定义列名称。 JSON解析器负责将JSON文本转换为另一个表示形式, 该表示形式必须根据JSON语法接受所有文本。它还可以接受非JSON形式或扩展名。

阅读之前, 我们必须导入JSON文件。

import pandas as pd

data = pd.read_json('hrdata.json')

print(data)

输出

Name Hire Date Salary Leaves Remaining

0 John Idle 08/15/14 50000.0 10

1 Smith Gilliam 06/01/15 65000.0 6

2 Parker Chapman 05/12/14 45000.0 7

3 Jones Palin 11/01/13 70000.0 3

4 Terry Gilliam 08/12/14 48000.0 9

5 Michael Palin 05/23/13 66000.0 8

从SQL数据库读取

为了从SQL读取文件, 首先, 你需要使用Python库建立连接, 然后将查询传递给pandas。在这里, 我们使用SQLite进行演示。

首先, 我们必须安装pysqlite3并在终端中运行以下命令:

pip install pysqlite3

sqlite3用于建立与数据库的连接, 然后我们可以使用它通过SELECT查询生成一个DataFrame。

建立与SQLite数据库文件的连接:

import sqlite3

con = sqlite3.connect("database.db")

SQLite数据库中存在一个称为信息的表, 该列的索引称为”索引”。我们可以通过传递SELECT查询和con从信息表中读取数据。

df = pd.read_sql_query("SELECT * FROM information", con)

输出

Index E_id Designation

0 46 M.Com

1 47 B.Com

2 48 B.Com