扫码加入数据分析学习群
问题描述:
缺失值处理的方法有哪些?
解决方法:
缺失值处理通常有如下几种方式:
- 以特定值填充,有些NAN值具有特殊意义
- 使用该特征的均值或中位数进行填充,适用于数值型特征
- 使用该特征的众数进行填充,适用于分类型或离散型特征
- 参考同类特征进行填充,如Houseprice中可以参考同处一个Neighborhood的特征的数值分布进行缺失值填充
- 直接删除,适用于缺失值过多,且该特征方差过小的情况
添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
评论(0)
暂无数据