我得到了一个包含许多NaN值的数据集,我想用每列的平均值填充空值。所以我尝试了以下代码:
def fill_mean():
m = [df.columns.get_loc(c) for c in df.columns if c in missing]
for i in m:
df[df.columns[i]] =df[df.columns[i]].fillna(value=df[df.columns[i]].mean())
return df
但我得到一个错误:
^{pr2}$
我试图填充的列都由同一类型组成:即“float64”或“O”。
我怀疑这个问题是由这个事实引起的,但我怎样才能解决它呢?在
编辑:我创建了一个包含列的字典,其中包含缺少某些数据的列的索引以及每列的类型。在di = dict(zip(missing, m2))
def fill_mean():
m = [df.columns.get_loc(c) for c in df.columns if c in missing]
for i in m:
if di[m] == "dtype('float64')":
df[df.columns[i]] = df[df.columns[i]].fillna(value=df[df.columns[i]].mean())
return df
我的意思是,如果我现在运行的是另一个错误:if di[m] == "dtype('float64')":
TypeError: unhashable type: 'list'