一、创建DataFrame

  1. 从列表创建
  2. 从数组创建
  3. 从字典创建
    字典的键作为dataframe的列索引,行索引默认为数字,从0开始。
    如果字典里有多个值是列表,则每一个列表的长度必须相等,如果有单个元素作为值,则会自动填充到与列表相同的长度。
  4. 自定义指定DataFrame的索引
    index 指定行索引
    columns 指定列索引

    创建时间序列,使用时间序列作为索引
    pd.date_range(‘20190722’, periods=3)
    20190722 是序列开始时间
    periods 是序列长度

二、查看DataFrame信息

以如下dataframe为例

dataframe更改索引 python dataframe 设置索引_python


查看行索引

dataframe更改索引 python dataframe 设置索引_测试数据_02


查看列索引

dataframe更改索引 python dataframe 设置索引_时间序列_03


查看每一列的数据类型

dataframe更改索引 python dataframe 设置索引_pandas_04


查看详细信息

dataframe更改索引 python dataframe 设置索引_自定义_05

DataFrame取数据

测试数据

dataframe更改索引 python dataframe 设置索引_测试数据_06

按索引取

取某一列

dataframe更改索引 python dataframe 设置索引_自定义_07


取某一行

dataframe更改索引 python dataframe 设置索引_自定义_08

高级索引

格式:dataframe.loc[ 行索引 , 列索引 ]
在高级索引 loc 中遵循的是左闭右闭的原则,按索引取值

1、取第一列和第三列

dataframe更改索引 python dataframe 设置索引_python_09


2、取第一列到第三列(左闭右闭)

dataframe更改索引 python dataframe 设置索引_自定义_10


3、只取某一列

dataframe更改索引 python dataframe 设置索引_测试数据_11


4、取第一行

dataframe更改索引 python dataframe 设置索引_时间序列_12


4、取不连续多行(第一行,第三行)

取多行的时候返回DataFrame

dataframe更改索引 python dataframe 设置索引_python_13


5、取连续多行(第一行到第四行)

dataframe更改索引 python dataframe 设置索引_测试数据_14


6、行和列同时操作

dataframe更改索引 python dataframe 设置索引_测试数据_15


dataframe更改索引 python dataframe 设置索引_pandas_16

位置索引

格式: DataFrame.iloc[ 行下标 :列下标 ]

与高级索引的使用基本相同,唯一要注意的就是下标是左闭右开

dataframe更改索引 python dataframe 设置索引_python_17


dataframe更改索引 python dataframe 设置索引_测试数据_18


dataframe更改索引 python dataframe 设置索引_python_19