STEP1:

#读取数据:

import pandas as pd
inputfile_1 = "F:\\大论文实验\\数据处理\\贫困人口数据_2015.xlsx"

data1 = pd.read_excel(inputfile_1)

#数据分组:groupby

data1_1 = data1.groupby('贫困户编号')['文化程度'].sum()#根据贫困户编号进行分类,计算每一户的文化程度的和

#利用agg函数

df[["ext price", "quantity", "unit price"]].agg(['sum', 'mean'])

#结合groupby&agg

data1_1 = data1.groupby(by = '贫困户编号').agg({'文化程度':['sum','mean'],'健康状况':['sum','mean']})

data1_1 = data1.groupby(by = ['乡镇','性别']).agg({'文化程度':['sum','mean'],'健康状况':['sum','mean']})#组合类别