2019-01-15
阅读量:
1047
双聚类是怎么回事
Biclustering 可以使用 sklearn.cluster.bicluster
模块。 Biclustering 算法对数据矩阵的行列同时进行聚类。 同时对行列进行聚类称之为 biclusters。 每一次聚类都会通过原始数据矩阵的一些属性确定一个子矩阵。
例如, 一个矩阵 (10, 10)
, 一个 bicluster 聚类,有三列二行,就是一个子矩阵 (3, 2)
>>> import numpy as np
>>> data = np.arange(100).reshape(10, 10)
>>> rows = np.array([0, 2, 3])[:, np.newaxis]
>>> columns = np.array([1, 2])
>>> data[rows, columns]
array([[ 1, 2],
[21, 22],
[31, 32]])
为了可视化, 给定一个 bicluster 聚类,数据矩阵的行列可以重新分配,使得 bi-cluster 是连续的。
算法在如何定义 bicluster 方面有一些不同,常见类型包括:
- 不变的 values , 不变的 rows, 或者不变的 columns。
- 异常高的或者低的值。
- 低方差的子矩阵。
- 相关的 rows 或者 columns。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论