STEP1:
#读取数据:
import pandas as pd
inputfile_1 = "F:\\大论文实验\\数据处理\\贫困人口数据_2015.xlsx"
data1 = pd.read_excel(inputfile_1)
#数据分组:groupby
data1_1 = data1.groupby('贫困户编号')['文化程度'].sum()#根据贫困户编号进行分类,计算每一户的文化程度的和
#利用agg函数
df[["ext price", "quantity", "unit price"]].agg(['sum', 'mean'])
#结合groupby&agg
data1_1 = data1.groupby(by = '贫困户编号').agg({'文化程度':['sum','mean'],'健康状况':['sum','mean']})
data1_1 = data1.groupby(by = ['乡镇','性别']).agg({'文化程度':['sum','mean'],'健康状况':['sum','mean']})#组合类别