shauna570392

2020-07-14   阅读量: 1068

Python

无标签无监督学习如何理解?

扫码加入数据分析学习群

定义


无监督学习,是指机器通过学习没有标签的数据,根据特征将它们分为若干类别的过程。


相对于监督学习,无监督学习使用的是没有标签的数据。机器会主动学习数据的特征,并将它们分为若干类别,相当于形成「未知的标签」。比如我们向机器输入一些未经标注的樱桃数据后,机器会主动学习樱桃的特征,并将拥有相似特征的樱桃归为一类。颜色深红且果实较大的樱桃(甜的)可能会被分到一类,而颜色鲜红且果实较小的樱桃(酸的)则可能会被分到另一类。

无监督学习可以将不同特征的樱桃分类,但并不能直接告诉我们上面的第一类樱桃是甜的,而第二类是酸的。因为我们若不做标注,机器本身并没有甜或酸的概念。



无监督学习的特点

在实际使用无监督学习对樱桃进行分类的过程中,可能的情况之一是叶片边缘呈锯齿状的樱桃被分到了一组,叶片边缘无锯齿的被分到了一组。经过研究后发现,无监督学习将这些樱桃分为了「针叶樱桃」与「樱桃」两组。

如果不使用无监督学习,恐怕不会发现樱桃数据中的这层联系。


原文链接:https://www.zhihu.com/question/304499918/answer/552071540

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
13.9043 4 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子