cda

数字化人才认证

首页 > 行业图谱 >

使用R语言预测泰坦尼克号乘客生存率

使用R语言预测泰坦尼克号乘客生存率
2017-06-09
使用R语言预测泰坦尼克号乘客生存率 1912年4月10日,号称 “世界工业史上的奇迹”的豪华客轮泰坦尼克号开始了自己的处女航,从英国的南安普顿出发驶往美国纽约,4月14日晚,泰坦尼克号在北大西洋撞上冰山而倾覆 ...

利用R语言的Boruta包进行特征选择

利用R语言的Boruta包进行特征选择
2017-06-09
利用R语言的Boruta包进行特征选择 变量选择是模型构建的一个重要方面,每个分析人员都必须学习。毕竟,它有助于排除相关变量、偏见和不必要噪音的限制来建立预测模型。 许多分析新手认为,保持所有(或更多 ...

大数据在银行信贷业务中的应用实践

大数据在银行信贷业务中的应用实践
2017-06-05
大数据在银行信贷业务中的应用实践 大数据是当前社会各界的热点议题之一。商业银行作为社会各机构中最早积累、应用大数据的主体,在大数据领域已经探索出了不少成熟的、有价值的应用模式。随着利率市场化改革临 ...

大数据到底怎么学:数据科学概论与大数据学习误区

大数据到底怎么学:数据科学概论与大数据学习误区
2017-06-05
大数据到底怎么学:数据科学概论与大数据学习误区 最近不少网友向我咨询如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题。由于大数据技术涉 ...

用交叉验证改善模型的预测表现-着重k重交叉验证

用交叉验证改善模型的预测表现-着重k重交叉验证
2017-05-25
用交叉验证改善模型的预测表现-着重k重交叉验证 机器学习技术在应用之前使用“训练+检验”的模式(通常被称作”交叉验证“)。 预测模型为何无法保持稳定? 让我们通过以下几幅图来理解这个问题: ...

18本数据科学家必读的R语言和Python相关书籍

18本数据科学家必读的R语言和Python相关书籍
2017-05-25
前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到的始终没有从书本中学到的多。 了解机器学习和数据科学很容易。目前有许多开放课程,你可以马上就开始学习。但是 ...

R文本分类之RTextTools

R文本分类之RTextTools
2017-05-09
R文本分类之RTextTools 古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。 它集成了(或者说支持)如下算法相关的包: 支持向量机(Support Vec ...

三张图读懂机器学习:基本概念、五大流派与九种常见算法

三张图读懂机器学习:基本概念、五大流派与九种常见算法
2017-05-09
三张图读懂机器学习:基本概念、五大流派与九种常见算法 机器学习正在进步,我们似乎正在不断接近我们心中的人工智能目标。语音识别、图像检测、机器翻译、风格迁移等技术已经在我们的实际生活中开始得到了应用 ...

好课推荐丨CDA建模分析师-R语言

好课推荐丨CDA建模分析师-R语言
2017-05-05
数据科学家被认为是21世纪最性感也是最具发展前景的职业,目前有75%左右的数据科学家使用R语言,有35%左右的数据科学家将R语言作为首选统计分析工具。今天,我们来了解一下R语言的前世今生。 一、R的诞生 ...
【广东粤数大数据有限公司】招聘数据分析师
2017-05-02
【广东粤数大数据有限公司】招聘数据分析师     职位月薪:18000-30000元/月     工作地点:深圳-南山区     发布日期:5/2/2017 11:55:30 AM     工 ...

数据挖掘基本任务

数据挖掘基本任务
2017-05-02
数据挖掘基本任务 数据挖掘主要做什么?换而言之,数据挖掘主要解决什么问题呢?这些问题,可以归结为数据挖掘的基本任务。 数据挖掘的基本任务包括分类与预测、聚类分析、关联规则、奇异值检测和智能推荐等 ...

大数据时代下的数据挖掘简析

大数据时代下的数据挖掘简析
2017-04-12
大数据时代下的数据挖掘简析 随着大数据的兴起,隐藏在大数据背后的相关技术也逐渐被揭开神秘的面纱,其中,数据挖掘即是大数据应用过程中非常重要的环节。以下是国内领先的移动大数据服务商极光大数据的副总裁 ...

简单易学的机器学习算法—AdaBoost

简单易学的机器学习算法—AdaBoost
2017-03-28
简单易学的机器学习算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting两种方法,随机森林算法是基于Bagging思想的机器学习算法,在Bagging方法中,主要通过对训练数据集 ...

简单易学的机器学习算法—集成方法(Ensemble Method)

简单易学的机器学习算法—集成方法(Ensemble Method)
2017-03-28
简单易学的机器学习算法—集成方法(Ensemble Method) 一、集成学习方法的思想 前面介绍了一系列的算法,每个算法有不同的适用范围,例如有处理线性可分问题的,有处理线性不可分问题。在现实世界的生活中, ...

数据挖掘十大算法之CART详解

数据挖掘十大算法之CART详解
2017-03-16
数据挖掘十大算法之CART详解 CART生成 CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将 ...

干货:逻辑回归构建申请信用评级案例

干货:逻辑回归构建申请信用评级案例
2017-03-08
概述:本文基于 R 语言,通过一个逻辑回归构建汽车贷款申请信用评级的案例,来为大家简单介绍信用风险模型及建模流程、R 语言实现、及中间需要注意的一些问题。包含的主要内容有以下几部分: ● 信用 ...

聊一聊特征学习在用户偏好预测中的应用

聊一聊特征学习在用户偏好预测中的应用
2017-03-02
本文聊聊如何利用客户购买行为预测其偏好。 为了基于客户购买行为预测其偏好,可以利用机器学习中比较新兴的稀疏编码和稀疏限制性玻尔兹曼机将原始数据变换成稀疏高纬表示。这些特征学习技巧独立于预测模 ...

R语言中的缺失值处理

R语言中的缺失值处理
2017-02-27
R语言中的缺失值处理 在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失值处 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2017-02-26
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户 ...

OK
客服在线
立即咨询