1.pandas是什么库

Pandas是Python第三方库,提供高性能易用数据类型和分析工具,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

数据分析-pandas库快速了解_python

与numpy对比区别:

数据分析-pandas库快速了解_数据类型_02

2.pandas库怎么用

安装

pip install pandas

导入

import pandas as pd

3.pandas两个数据类型

两个数据类型:Series, DataFrame

Series类型

Series类型由一组数据及与之相关的数据索引组成

数据分析-pandas库快速了解_数据_03

第一列的0,1,2,3是自动索引,第二列是实际数据值,最后的dtype表示数据类型

数据分析-pandas库快速了解_数据_04

Series类型数据的常见创建方式

python列表

数据分析-pandas库快速了解_数据_05

标量值

数据分析-pandas库快速了解_python_06

python字典

数据分析-pandas库快速了解_数据类型_07

ndarray

数据分析-pandas库快速了解_数据_08

Series类型数据的基本操作

获得索引和数据

数据分析-pandas库快速了解_python_09

更改索引

数据分析-pandas库快速了解_数据类型_10

索引

数据分析-pandas库快速了解_数据类型_11

切片

数据分析-pandas库快速了解_数据_12

DataFrame类型

DataFrame类型由共用相同索引的一组列组成,是一个表格型的数据类型,每列值类型可以不同,既有行索引、也有列索引,常用于表达二维数据。

数据分析-pandas库快速了解_python_13

数据分析-pandas库快速了解_数据_14

DataFrame类型数据的常见创建方式

二维ndarray对象

数据分析-pandas库快速了解_数据类型_15

一维ndarray、列表、字典、元组或Series构成的字典

数据分析-pandas库快速了解_数据类型_16

数据分析-pandas库快速了解_数据类型_17

数据分析-pandas库快速了解_数据类型_18

DataFrame类型数据的基本操作

获得行列索引和数据

数据分析-pandas库快速了解_数据类型_19

更改行列索引

数据分析-pandas库快速了解_python_20

选择数据

索引切片获取列数据和单个数据

数据分析-pandas库快速了解_数据类型_21

索引切片获取行数据

数据分析-pandas库快速了解_数据类型_22

iloc():按照索引的位置来选取,​这里要注意这种方式是包含切片的末尾的数据的

数据分析-pandas库快速了解_python_23

loc():按照索引index的值选取,如果没有自定义值,行数据也可以通过切片获取。

数据分析-pandas库快速了解_python_24

数据分析-pandas库快速了解_数据类型_25

数据分析-pandas库快速了解_python_26

4.查看数据

数据分析-pandas库快速了解_数据_27

5.文件数据读取和保存

保存

数据分析-pandas库快速了解_数据类型_28

读取

这里多了一列数据是因为上面写入时把索引写入了,可以再写入时去掉index,to_csv(file,index=False)

数据分析-pandas库快速了解_数据_29

限于篇幅原因,还有更多内容(空值处理,分组,合并,排序,删除等),这个会在后面的具体场景中应用。

(全文完)


长按二维码,加关注!叶子陪你玩

数据分析-pandas库快速了解_数据类型_30


欢迎转载,转载请注明出处!

欢迎关注公众微信号:叶子陪你玩编程 分享自己的python学习之路