cda

数字化人才认证

首页 > 行业图谱 >

大数据等最核心的关键技术:32个算法

大数据等最核心的关键技术:32个算法
2017-05-09
大数据等最核心的关键技术:32个算法 奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者 ...

《数学之美》拾遗—潜在语义索引(LSI)

《数学之美》拾遗—潜在语义索引(LSI)
2017-03-25
《数学之美》拾遗—潜在语义索引(LSI) 一、潜在语义索引的提出 潜在语义索引(LSI),又称为潜在语义分析(LSA),是在信息检索领域提出来的一个概念。主要是在解决两类问题,一类是一词多义,如“bank”一词 ...

简单易学的机器学习算法—主成分分析(PCA)

简单易学的机器学习算法—主成分分析(PCA)
2017-03-24
简单易学的机器学习算法—主成分分析(PCA) 一、数据降维     对于现在维数比较多的数据,我们首先需要做的就是对其进行降维操作。降维,简单来说就是说在尽量保证数据本质的前提下将数据中的维 ...

大数据挖掘:数据模型多了,应该怎么管

大数据挖掘:数据模型多了,应该怎么管
2016-11-24
大数据挖掘:数据模型多了,应该怎么管 没有数据分析和建模能力,肯定难以提升业务;然而,如果模型泛滥、没有得到有效的统筹管理,其提升度恐怕也非常有限,还可能制造各种混乱。为了解决这样的问题,“模型工 ...

数据模型多了,应该怎么管

数据模型多了,应该怎么管
2016-11-22
数据模型多了,应该怎么管 随着近年来大数据挖掘概念的兴起,数据分析建模的思想已经深入人心,于是会建模、能建模的人也就越来越多。他们可能是资深大拿,分析建模、结果解读手到擒来全搞定,但也可能是专业 ...
短文本主题建模方法
2016-11-22
短文本主题建模方法 1. 引言 许多数据分析应用都会涉及到从短文本中提取出潜在的主题,比如微博、短信、日志文件或者评论数据。一方面,提取出潜在的主题有助于下一步的分析,比如情感评分或者文本分类模型 ...

想了解机器学习?你需要知道的十个基础算法

想了解机器学习?你需要知道的十个基础算法
2016-08-18
想了解机器学习?你需要知道的十个基础算法 毫无疑问,作为人工智能的子领域—机器学习在过去的几年中越来越受欢迎。由于大数据是目前科技行业最热门的趋势,基于大量的数据机器学习在提前预测和做出建议方面有 ...

在Python中实现推荐系统!

在Python中实现推荐系统!
2016-06-30
现今,推荐系统被用来个性化你在网上的体验,告诉你买什么,去哪里吃,甚至是你应该和谁做朋友。人们口味各异,但通常有迹可循。人们倾向于喜欢那些与他们所喜欢的东西类似的东西,并且他们倾向于与那些亲近的人有 ...

数据挖掘:推荐系统综述以及美团推荐系统介绍

数据挖掘:推荐系统综述以及美团推荐系统介绍
2015-12-29
数据挖掘:推荐系统综述以及美团推荐系统介绍 文 | 宿痕 来源 | 知乎 其实推荐系统前面已经讲过不少,那时候主要是放在机器学习上讲的,既然这次要系统撸一遍数据挖掘,就把推荐系统单 ...
常用的机器学习&数据挖掘知识(点)
2015-12-20
常用的机器学习&数据挖掘知识(点) Basis(基础): MSE(Mean Square Error 均方误差), LMS(LeastMean Square 最小均方), LSM(Least Square Methods 最小二乘法), MLE(MaximumLike ...
在机器学习方面使用 R + Hadoop 方案真的有那么好2
2015-05-15
在机器学习方面使用 R + Hadoop 方案真的有那么好2 第3、4步,这里虽然举了很简单的例子,但这些是在数学模型和数据模型上是最没有开发压力的,需要关心的只是资深程序员的功底了。举例说明,文本挖掘( ...
在机器学习方面使用 R + Hadoop 方案真的有那么好
2015-05-15
在机器学习方面使用 R + Hadoop 方案真的有那么好 为什么有些公司在机器学习业务方面倾向使用 R + Hadoop 方案? 因为他们在不懂R和Hadoop的特征应用场景的情况下,恰好抓到了一根免费,开源的稻 ...

2014到2015年蜕变:大象在跳舞,Hadoop从离线到在线

2014到2015年蜕变:大象在跳舞,Hadoop从离线到在线
2015-04-05
2014到2015年蜕变:大象在跳舞,Hadoop从离线到在线 时代在变迁,市场在变化,周边的软硬件环境也突飞猛进般的发展,同时企业的业务需求也不断升级,从规模到成本都有较高的要求,这刺激Hadoop生态圈 ...
探寻微博背后的大数据原理:微博推荐算法简述
2015-01-03
探寻微博背后的大数据原理:微博推荐算法简述 “We are leaving the age of information and entering the age of recommendation” — Chris Anderson in The Long Tail。 我们正在远离信息,而 ...

美国的“大数据”战略新动向_数据分析师

美国的“大数据”战略新动向_数据分析师
2014-12-09
美国的“大数据”战略新动向_数据分析师  大数据的发展与应用已经对美国社会的方方面面产生深远影响。美国白宫发布的《2014年大数据白皮书》中提到:“大数据的爆发带给政府更大 的权利,为社会 ...
R+Hadoop方案为何成为企业学习业务的首选_数据分析师
2014-11-14
R+Hadoop方案为何成为企业学习业务的首选_数据分析师 众所周知,R在解决统计学问题方面无与伦比。但是R在数据量达到2G以上速度就很慢了,于是就催生出了与Hadoop相结合跑分布式算法这种解决方案,但是,pyt ...

数据挖掘中所需的概率论与数理统计知识​(三)

数据挖掘中所需的概率论与数理统计知识​(三)
2014-11-11
数据挖掘中所需的概率论与数理统计知识(三) 从数学期望、方差、协方差到中心极限定理 3.1、数学期望、方差、协方差 3.1.1、数学期望      如果X是在概率空间(Ω,&nbs ...
大数据的思维误区与价值纬度_数据分析师
2014-11-06
大数据的思维误区与价值纬度 清华基于微博分析获得的大数据幸福指数发现人们周六最幸福,相信大家心情不错,因此今天不谈枯燥的技术。关于大数据的思维、理念、方法论已经被反复消费了,本来我想直接进入交互环 ...

微博背后的大数据算法探寻:微博推荐算法简述

微博背后的大数据算法探寻:微博推荐算法简述
2014-09-02
      当今,大数据时代,探寻微博背后的大数据算法,在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推荐系统适用哪些场景?用来解决什么问题、具有怎样的 ...

OK