登录
首页大数据时代pandas缺失值的填补方法——fillna
pandas缺失值的填补方法——fillna
2020-07-06
收藏

在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介绍pandas缺失值的填补方法——fillna。

fillna:用指定值或插值的方法填充缺失数据

分为值填充、前后向填充(与ffill方法和bfill方法等价)

df = pd.read_csv('data/table_missing.csv')

# 值填充

df['Physics'].fillna('missing').head()

# 前向填充:后一个值往前填

df['Physics'].fillna(method='ffill').head()

# 后向填充:下一个值往后填

df['Physics'].fillna(method='backfill').head()

值填充中需要注意对齐特性。具体见下面例子:

df_f = pd.DataFrame({'A':[1.3.np.nan],'B':[2.4.np.nan],'C':[3.5.np.nan]})

df_f.fillna(df_f.mean())

在这里插入图片描述

df_f = pd.DataFrame({'A':[1.3.np.nan],'B':[2.4.np.nan],'C':[3.5.np.nan]})

df_f.fillna(df_f.mean())

在这里插入图片描述

以上就是小编今天分享的pandas缺失值的填补方法——fillna,希望对大家缺失值的处理有所帮助。

数据分析咨询请扫描二维码

客服在线
立即咨询