使用分组, 不同组下的缺失值,用其对应组的均值填充,实用!!!
df = pd.DataFrame([
['1','小明', 18],
['2','小强', 19],
['2','小丽', 20],
['2','小花', np.NaN],
['1','小张', np.NaN]
],columns=['班级','name', 'age'], index=['a','b','c','d','e'])
df.groupby('班级')['age'].apply(lambda x: x.fillna(x.mean()))
2班的均值 19.5
1班的均值 18
感谢老师!
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar