登录
首页精彩阅读大数据、数据挖掘、机器学习与模式识别的关系
大数据、数据挖掘、机器学习与模式识别的关系
2018-06-19
收藏

大数据、数据挖掘机器学习与模式识别的关系

数据挖掘机器学习、模式识别三者的关系,可以说是一脉相承。与数据挖掘机器学习、模式识别相关的书籍很多,但其实讲的东西都是大同小异,换汤不换药。无非就是神经网络支持向量机、各种分类、聚类、回归的算法,还有深度学习
   

  毋庸置疑,我们已进入大数据时代,大数据是个笼统的概念。大数据在1980年被提出来,最近被炒作地很热,也是媒体忽悠的一个概念。随着网络的发展,使得各种数据的获取更加便捷,大数据是对各种数据的统称。其实大数据并不仅仅指海量的数据,把上亿条关系型数据库称为大数据也有一点肤浅。普遍认为,大数据应该具备三个特征

  1. 数据量大;这是最基本的特征,不必解释。
  2. 结构复杂;这应该是区别传统数据的重要特征,我们所熟悉的数据存储格式基本上都是基于关系型数据库的二维表格数据。但是我们通过网络或传感器获取的数据,并不能通过简单的表格表示,数据结构可能是树状的、网状的,这对数据的预处理提出了更高的要求。
  3. 数据更新速度快;需要对最新的数据做出实时的反馈。当你在淘宝买了一部手机,马云会马上会推荐你手机壳、手机套、手机贴膜之类的。

有人提出:数据挖掘=大数据+机器学习。感觉这样描述这三者的关系再适合不过了。机器学习强调计算机的学习能力,注重算法。大数据是各种数据的一种概念描述。数据挖掘我们最终的目的,我们使用机器学习的方法从海量的复杂的数据中找出对我们有用的信息,即知识发现。

我们可以这理解:模式识别=数据+机器学习。模式识别的本质就是分类和聚类,也就是监督模式识别与非监督模式识别。模式识别最重要的应用就是信息处理领域了,如图像识别、语音识别。

这里为什么用“数据”,因为这里通常是图像、语音、文本等之类的数据。其实也没必要在一些概念上较真。没必要探究某些数据到底是不是大数据。不管是不是大数据,处理的方法都是一样的,只不过,“大数据”显得的牛B一点。

大数据是一个时代性的概念,是社会发展的必然产物,如同互联网时代、物联网时代等等,现在可以说我们处于大数据时代,一个信息爆炸的时代,任何数据都可以称为大数据,甚至用excel处理数据都可以称为大数据处理。如同,高大上的智能家居可以说属于物联网的范畴,老旧的pos机也属于物联网的范畴。

从知识发现到数据挖掘再到大数据,并没有本质的变化,都在进一步步强调数据的重要性。


数据分析咨询请扫描二维码

客服在线
立即咨询