热线电话:13121318867

登录
2020-04-13 阅读量: 923
为什么要先去除重复值

对于一般模型影响不大,但对于回归模型而言,容易易导致回归系数标准误降低,使得对应p值减小。

重复值过多,样本随机误差降低,造成参数的贡献程度会被高估。

一般代码为:drop_duplicates(inplace=True)

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子