CDA数据科学研究院 CDA考试中心 CDA人工智能学院 企业服务 关于CDA

cda

全国校区

您的位置:首页 > 大数据时代 > 机器学习里的无监督学习是什么?

机器学习里的无监督学习是什么?

2020-06-30

无监督学习是机器学习里的一种学习方式,下面将给大家具体解释一下无监督学习到底是什么?

首先我们可以对照监督学习来对比理解一下无监督学习的概念。

机器学习中,监督学习是一种明确的训练方式,你能够很明确知道自己得到的是什么,并且由于明确了目标,所以能够衡量效果。在监督学习中,我们需要需要给数据打标签,然后根据这些标注了的数据来拟合一个假设函数。

无监督学习则不同,它没有明确目的,我们无法提前知道结果是什么,所以几乎无法进行效果衡量。而且无监督学习中数据没有标签,我们需要把这些无标签数据输入到一个算法中,然后要求这个算法帮我们在这个数据集中找到它的内在结构。

无监督学习常见的两种类型是:聚类和数据集变换。

简单说聚类就是一种自动分类的方法,将数据划分成不同的组,每组包含相似的物项。但是我们可能并不清楚聚类后的几个分类每个代表什么意思。举个例子,用户在某个网站上传了照片,网站可能想要将同一用户的照片分在一组。但网站对于每张照片是谁,照片集中总共出现了多少个人并不清楚。比较明智的解决方法是提取所有照片中的人脸,把看起来相似的人脸分在一组,这样就完成了对图片的分组了。

数据集变换,就是创建数据集新的表示算法,对于这种新的表示,机器学习算法可能更容易理解。

常见的应用是降维,就是找到能够表示拥有许多特征的高维数据的一种新方法,用较少的特征就可以概括其重要特性。看上去很像压缩,但其实是为了既能尽可能保存相关的结构,又能同时降低数据的复杂度。另一个应用就是找到“构成”数据的各个组成部分,比如在文本文档中进行关键字提取。

完 谢谢观看

分享
收藏

OK