田齐齐

2020-03-19   阅读量: 923

数据分析师 Python数据分析 Python编程 数据挖掘 机器学习

模拟生成不均衡的数据中心点和离散程度设置

扫码加入数据分析学习群

问:不均衡的数据指label为0和1的样本比例不一样 那在生成不均衡数据的时候 设置中心点和离散程度可以省略 或者让class1和class2的中心点和离散程度完全一致吗?

答:在模拟的数据集中,原则上是可以这样设置的,但用中心点和离散程度完全一致的数据集做聚类效果很差.为了将模拟确实有明显分类的数据我们一般需要设置class1和class2的中心点和离散程度.

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
36.3750 6 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子