詹惠儿

2020-10-26   阅读量: 455

Python

python中make_blobs生成的数据是随机的吗?random_state=r是什么意思?

扫码加入数据分析学习群

问:

python中make_blobs生成的数据是随机的吗?random_state=r是什么意思?



答:

是的,python中make_blobs生成的数据是随机的,scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,

make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。其语法如下:

sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)

random_state=r表示设置生成随机数的种子为r(r为整数),其他比较常用的参数说明如下:

n_samples是待生成的样本的总数。

n_features是每个样本的特征数。

centers表示类别数。

cluster_std表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0]。


50.0000 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子