无标签无监督学习如何理解?

shauna570392

2020-07-14 阅读量: 1744

无标签无监督学习如何理解?

定义

无监督学习，是指机器通过学习没有标签的数据，根据特征将它们分为若干类别的过程。

相对于监督学习，无监督学习使用的是没有标签的数据。机器会主动学习数据的特征，并将它们分为若干类别，相当于形成「未知的标签」。比如我们向机器输入一些未经标注的樱桃数据后，机器会主动学习樱桃的特征，并将拥有相似特征的樱桃归为一类。颜色深红且果实较大的樱桃（甜的）可能会被分到一类，而颜色鲜红且果实较小的樱桃（酸的）则可能会被分到另一类。

无监督学习可以将不同特征的樱桃分类，但并不能直接告诉我们上面的第一类樱桃是甜的，而第二类是酸的。因为我们若不做标注，机器本身并没有甜或酸的概念。

无监督学习的特点

在实际使用无监督学习对樱桃进行分类的过程中，可能的情况之一是叶片边缘呈锯齿状的樱桃被分到了一组，叶片边缘无锯齿的被分到了一组。经过研究后发现，无监督学习将这些樱桃分为了「针叶樱桃」与「樱桃」两组。

如果不使用无监督学习，恐怕不会发现樱桃数据中的这层联系。

原文链接：https://www.zhihu.com/question/304499918/answer/552071540