809669515

2018-11-01   阅读量: 999

数据分析师 机器学习 数据挖掘

自组织映射

扫码加入数据分析学习群

自组织映射(SOM)用于高维数据集的可视化和分析。SOM有助于将高维数据集呈现为较低维度的数据集,通常是1-D,2-D和3-D。它是一种无监督的学习算法,并且不需要目标向量,因为它学会了在没有监督的情况下对数据进行分类。SOM由输入数据所呈现的节点或单元的网格形成。每个节点都连接到输入,节点之间没有连接。SOM是一种拓扑保留技术,可以将邻域关系保留在其映射表示中。 

算法

1-使用0到1之间的随机数初始化每个节点的权重

2-从训练数据集中选择随机输入向量3-计算最佳匹配单位(BMU)。检查每个节点以找到其权重与输入向量最相似的节点。该单元被称为最佳匹配单元(BMU),因为其向量与输入向量最相似。该选择由欧几里德距离公式完成,该公式是两个数据集之间相似性的度量。计算输入矢量和节点权重之间的距离以便找到BMU。

4-计算BMU周围邻域的大小。BMU周围邻域的大小随着指数衰减函数而减小。它在每次迭代时缩小,直到达到BMU。 

5-修改BMU和相邻节点的节点权重,使其权重更接近输入向量的权重。调整邻域内每个节点的权重,对靠近BMU的邻居进行更大的改变。 

每次迭代计算学习率的衰减。

随着培训的进行,社区逐渐缩小。在训练结束时,社区缩小到零。

影响率表示节点与BMU的距离对其学习的影响程度。在最简单的形式中,对于靠近BMU的所有节点,影响率等于1,对于其他节点,影响率等于零,但高斯函数也是常见的。最后,从随机分布的权重和经过多次迭代,SOM能够到达稳定区域的地图。最后,数据的解释将由人类完成,但SOM是一种很好的技术,可以在数据中呈现不可见的模式。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子