
2020-07-06
在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介绍pandas缺失值的填补方法——fillna。
fillna:用指定值或插值的方法填充缺失数据
分为值填充、前后向填充(与ffill方法和bfill方法等价)
df = pd.read_csv('data/table_missing.csv')
# 值填充
df['Physics'].fillna('missing').head()
# 前向填充:后一个值往前填
df['Physics'].fillna(method='ffill').head()
# 后向填充:下一个值往后填
df['Physics'].fillna(method='backfill').head()
值填充中需要注意对齐特性。具体见下面例子:
df_f = pd.DataFrame({'A':[1.3.np.nan],'B':[2.4.np.nan],'C':[3.5.np.nan]})
df_f.fillna(df_f.mean())
df_f = pd.DataFrame({'A':[1.3.np.nan],'B':[2.4.np.nan],'C':[3.5.np.nan]})
df_f.fillna(df_f.mean())
以上就是小编今天分享的pandas缺失值的填补方法——fillna,希望对大家缺失值的处理有所帮助。
完 谢谢观看
上一篇: 关于numpy概念的简单理解 下一篇: 常用的python缺失值处理方法有哪几种 ...