cda

数字化人才认证

首页 > 行业图谱 >

R语言中样本平衡的几种方法
2017-12-06
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

大数据市场乱象:用人工智能讲故事 低质虚假数据大量

大数据市场乱象:用人工智能讲故事 低质虚假数据大量
2017-12-03
大数据市场乱象:用人工智能讲故事 低质虚假数据大量 大数据行业看上去似乎并没有受资本寒冬的影响。仅今年4月以来,大数据行业就有7家公司获得融资,其中国外4家、国内3家,金额总计约11亿元人民币。而这一情 ...

数据科学工作者(Data Scientist) 的日常工作内容包括什么

数据科学工作者(Data Scientist) 的日常工作内容包括什么
2017-11-26
数据科学工作者(Data Scientist) 的日常工作内容包括什么 众所周知,数据科学是这几年才火起来的概念,而应运而生的数据科学家(data scientist)明显缺乏清晰的录取标准和工作内容。即使在2017年,数据科学家这 ...

数据科学的十大常见误区 你中枪了吗?

数据科学的十大常见误区 你中枪了吗?
2017-11-11
数据科学的十大常见误区 你中枪了吗? 对于数据科学领域的新手来说,以下的十大常见误区每一条都是血与泪的教训。 对于数据科学领域的初学者和职场小白来说,理想往往很美好,现实却很骨感。理想的数据科学世 ...

10个令人相见恨晚的R语言包

10个令人相见恨晚的R语言包
2017-09-15
10个令人相见恨晚的R语言包 大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。 ...

探秘数据可视化,CDA从来都有故事,又不缺干货!(附福利)

探秘数据可视化,CDA从来都有故事,又不缺干货!(附福利)
2017-08-31
探秘数据可视化,CDA从来都有故事,又不缺干货!(附福利) 一场秋雨一场寒,赶在秋雨之前,C君又在线下跟大家面对面交流了。自7月29日的CDAS 2017中国数据分析师行业峰会以来,C君已经很久没有和大家线下一 ...

探秘数据可视化,CDA从来都有故事,又不缺干货!(附福利)

探秘数据可视化,CDA从来都有故事,又不缺干货!(附福利)
2017-08-30
探秘数据可视化,CDA从来都有故事,又不缺干货!(附福利) 一场秋雨一场寒,赶在秋雨之前,C君又在线下跟大家面对面交流了。自7月29日的CDAS 2017中国数据分析师行业峰会以来,C君已经很久没有和大家线下一起 ...
【福建淘汽互联科技有限公司司】招聘数据分析师
2017-08-01
【福建淘汽互联科技有限公司司】招聘数据分析师 福建淘汽互联科技有限公司,以大数据为驱动,对传统汽车销售/租赁产业进行互联网化模式升级,整合汽车主机厂、金融、保险、后市场服务等领域资源,打造汽车服务生态圈 ...

大数据分析如何在企业中落地?

大数据分析如何在企业中落地?
2017-07-24
一、大数据分析师和JAVA程序员有什么区别? Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快地进入了这个行业,成为了最早的大数据分析师。但IT人士的宿命就在 ...

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱
2017-07-24
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱 本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集-验证集二划分校验(Hold-out validation) ...

R语言与机器学习中的回归方法学习笔记

R语言与机器学习中的回归方法学习笔记
2017-07-21
R语言与机器学习中的回归方法学习笔记  机器学习中的一些方法如决策树,随机森林,SVM,神经网络由于对数据没有分布的假定等普通线性回归模型的一些约束,预测效果也比较不错,交叉验证结果也能被接受。下 ...
掌握8项技能让你顺利受雇于4种逼格最高的数据科学岗位
2017-07-19
你想找到一份数据科学家的工作吗?如果你有这样的想法的话,那么你就有伴儿了。最近由Thomas Davenport和D.J. Patil在《哈佛商业周刊》上面发表了一篇专栏,文章称“数据科学家”是21世纪最最性感的工作。 那么你怎 ...

好课推荐丨CDA建模分析师-R语言

好课推荐丨CDA建模分析师-R语言
2017-07-13
“虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法,凸优化… 感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,数据 ...

使用R语言预测泰坦尼克号乘客生存率

使用R语言预测泰坦尼克号乘客生存率
2017-06-09
使用R语言预测泰坦尼克号乘客生存率 1912年4月10日,号称 “世界工业史上的奇迹”的豪华客轮泰坦尼克号开始了自己的处女航,从英国的南安普顿出发驶往美国纽约,4月14日晚,泰坦尼克号在北大西洋撞上冰山而倾覆 ...

利用R语言的Boruta包进行特征选择

利用R语言的Boruta包进行特征选择
2017-06-09
利用R语言的Boruta包进行特征选择 变量选择是模型构建的一个重要方面,每个分析人员都必须学习。毕竟,它有助于排除相关变量、偏见和不必要噪音的限制来建立预测模型。 许多分析新手认为,保持所有(或更多 ...

大数据在银行信贷业务中的应用实践

大数据在银行信贷业务中的应用实践
2017-06-05
大数据在银行信贷业务中的应用实践 大数据是当前社会各界的热点议题之一。商业银行作为社会各机构中最早积累、应用大数据的主体,在大数据领域已经探索出了不少成熟的、有价值的应用模式。随着利率市场化改革临 ...

大数据到底怎么学:数据科学概论与大数据学习误区

大数据到底怎么学:数据科学概论与大数据学习误区
2017-06-05
大数据到底怎么学:数据科学概论与大数据学习误区 最近不少网友向我咨询如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题。由于大数据技术涉 ...

用交叉验证改善模型的预测表现-着重k重交叉验证

用交叉验证改善模型的预测表现-着重k重交叉验证
2017-05-25
用交叉验证改善模型的预测表现-着重k重交叉验证 机器学习技术在应用之前使用“训练+检验”的模式(通常被称作”交叉验证“)。 预测模型为何无法保持稳定? 让我们通过以下几幅图来理解这个问题: ...

18本数据科学家必读的R语言和Python相关书籍

18本数据科学家必读的R语言和Python相关书籍
2017-05-25
前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到的始终没有从书本中学到的多。 了解机器学习和数据科学很容易。目前有许多开放课程,你可以马上就开始学习。但是 ...

R文本分类之RTextTools

R文本分类之RTextTools
2017-05-09
R文本分类之RTextTools 古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。 它集成了(或者说支持)如下算法相关的包: 支持向量机(Support Vec ...

OK