2020-03-20
阅读量:
4137
机器学习:利用sklearn生成4个簇的数据
导包:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from sklearn.datasets import make_blobs
生成数据:
# X为样本特征,Y为样本簇类别, 共1000个样本,
# 每个样本 2 个特征,共4个簇,
# 簇中心在[-1,-1], [0,0],[1,1], [2,2],
# 簇标准差分别为[0.4, 0.2, 0.2,0.2]
X, y = make_blobs(n_samples=1000,n_features=2,
centers= [[-1,-1], [0,0],[1,1], [2,2] ], # 簇中心点的个数决定分成几簇
cluster_std=[0.4, 0.2, 0.2,0.2],random_state=666) # 决定每簇数据之间的离散程度指标

其中,如图分4个簇,是根据簇中心点的个数决定的






推荐帖子
0条评论
0条评论
0条评论