cda

数字化人才认证

首页 > 行业图谱 >

从大数据的风水图,来看到底大数据是怎么回事

从大数据的风水图,来看到底大数据是怎么回事
2016-02-26
从大数据的风水图,来看到底大数据是怎么回事 技术型的高科技创业公司都是喜欢闪闪发光的新东西,而“大数据”跟3年前火热程度相比反而有些凄惨。虽然Hadoop创建于2006年,在“大数据”的概念兴起到达白热化是在 ...
大数据之基于模型的复杂数据多维聚类析(三)​
2016-02-21
大数据之基于模型的复杂数据多维聚类析(三) 除了聚类,对于这个数据的分析还告诉我们一些隐藏很深的关系。比如在模型中变量Y2和Y3有连线,这表明一个人的背景信息和他对于贪污的容忍程度应该有一定的关联关系。 ...

大数据之基于模型的复杂数据多维聚类析(一)​

大数据之基于模型的复杂数据多维聚类析(一)​
2016-02-21
大数据之基于模型的复杂数据多维聚类析(一) 随着现实和虚拟世界的数据产生速度越来越迅猛,人们开始关注如何从这些数据中获取信息,知识,以及对于决策的支持。这样的任务通常被称作大数据分析(BigData Analyti ...

聚类算法之K均值

聚类算法之K均值
2016-01-08
聚类算法之K均值  有时候,我们只有训练样本的特征,而对其类型一无所知。这种情况,我们只能让算法尝试在训练数据中寻找其内部的结构,试图将其类别挖掘出来。这种方式叫做无监督学习。由于这种方式通常 ...
BAT三巨头开挖大数据
2016-01-07
BAT三巨头开挖大数据 实际上,对于大数据究竟是什么业界并无共识。大数据并不是什么新鲜事物。信息革命带来的除了信息的更高效地生产、流通和消费外,还带来数据的爆炸式增长。“引爆点”到来之后,人们发现原 ...

构建机器学习系统的20个经验教训

构建机器学习系统的20个经验教训
2016-01-05
构建机器学习系统的20个经验教训 数据科学家对优化算法和模型以进一步发掘数据价值的追求永无止境。在这个过程中他们不仅需要总结前人的经验教训,还需要有自己的理解与见地,虽然后者取决于人的灵动性,但是 ...
一分钟了解互联网数据挖掘流程
2015-12-31
一分钟了解互联网数据挖掘流程 1、爬虫抓取网络数据  真实的数据挖掘项目,一定是从获取数据开始的,除了通过一些渠道购买或者下载专业数据外,常常需要大家自己动手爬互联网数据,这个时候,爬虫就显 ...

BAT三巨头开始挖掘大数据

BAT三巨头开始挖掘大数据
2015-12-27
BAT三巨头开始挖掘大数据 阿里巴巴CTO即阿里云负责人王坚博士说过一句话:云计算和大数据,你们都理解错了。 实际上,对于大数据究竟是什么业界并无共识。大数据并不是什么新鲜事物。信息革命带来的除了信息 ...

详解自然语言处理(NLP)5大语义分析技术及14类应用(建议收藏)

详解自然语言处理(NLP)5大语义分析技术及14类应用(建议收藏)
2020-08-07
语言是人类区别其他动物的本质特性,也是人工智能的一个重要,甚至核心部分。用自然语言与计算机进行通信,这是人们长期以来所追求的。这就是涉及到了小编今天给大家推荐的这篇文章:详解自然语言处理(NLP)5大语义 ...

经典聚类算法Kmeans的基本原理及实现

经典聚类算法Kmeans的基本原理及实现
2020-07-24
Kmeans算法,又叫做K均值聚类算法,可以说是无监督聚类算法中最具代表性,最经典的聚类算法了,这一算法的主要作用是将相似的样本自动归到一个类别中。小编特意整理了这一经典聚类算法的基本原理供大家参考,希望 ...

CNN、RNN、GAN都是什么?终于有人讲明白了

CNN、RNN、GAN都是什么?终于有人讲明白了
2020-07-23
导读:深度学习已经存在了几十年,不同的结构和架构针对不同的用例而进行演变。其中一些是基于我们对大脑的想法,另一些是基于大脑的实际工作。本文将简单介绍几个业界目前使用的先进的架构。 作者:谢林·托马 ...

业务分析模型,该怎么搭建

业务分析模型,该怎么搭建
2020-07-22
文章来源: 接地气学堂 作者:接地气的陈老师 很多同学最怕听“建模型”仨字。尤其是建立“业务分析模型”。往往自己辛辛苦苦搞得LR、SVM、CNN被业务方狂喷:你这都是啥东西!脱离业务!不切实际! ...

半监督学习的种类都有哪些?

半监督学习的种类都有哪些?
2020-07-14
半监督学习(SSL),全称Semi-Supervised Learning,类属于机器学习(Machine Learning,ML)。在只有少量标记样本,大部分样本都是无标记的情况下,可以使用半监督学习方法,根据无标记样本与标记样本间的相似度、以及 ...

终于有人把数据科学、机器学习和人工智能讲明白了

终于有人把数据科学、机器学习和人工智能讲明白了
2020-07-10
作者:Alex Castrounis 来源:大数据DT(ID:hzdashuju) 内容摘编自《AI战略:更好的人类体验与企业成功框架》 导读:本文讨论与人工智能相关的概念和技术,包括机器学习、深度学习、数据科学和大数据。还 ...
Kmeans均值聚类算法的基本原理是什么?
2020-07-08
Kmeans算法属于无监督学习的一种聚类算法,这种算法的目的为:在数据所属类别及类别数量不明确的前提下,依据数据自身的特点对数据进行聚类。聚类过程中,对于类别数量k的选取,需要一定的先验知识,也可根据“类 ...

你需要掌握的4种常用数据降维方法

你需要掌握的4种常用数据降维方法
2020-07-09
近来数据记录和规模属性都在急剧增长,由于大多数数据挖掘算法都是直接逐列处理数据,因此导致算法越来越慢。为了保证减少数据列数的同时,丢失的数据信息尽可能少, 数据降维处理算法应运而生。 一、降维的 ...
特征工程是什么?常用的方法有哪些?
2020-07-07
“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器 ...

PCA降维原理(主成分分析)的数学理论

PCA降维原理(主成分分析)的数学理论
2020-07-03
在机器学习中,有成千上万甚至几十万的维度的数据需要处理,这种情况下机器学习的资源消耗是不可接受的,并且很大程度上影响着算法的复杂度,因此对数据降维是必要的。PCA(Principal Component Analysis)是一种常 ...
简单理解文本挖掘的定义与过程
2020-07-02
文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法,主要用途 ...
机器学习之有监督学习
2020-07-01
机器学习分为:有监督学习,无监督学习,半监督学习等。今天跟小编一起来看有监督学习的内容吧。 一、有监督学习定义 有监督学习,就是大家常说的分类,通过某种或某些特性的样本作为训练集,建立一个最优模 ...

OK