CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

您的位置:首页 > CDA发布 > 快速成为R语言全栈数据分析师

快速成为R语言全栈数据分析师

2017-02-15

R源自90年代S编程语言的一个开源版本,主要用于统计分析、绘图、数据挖掘,在高校及商业统计分析领域非常受欢迎。最新的O’Reilly数据科学薪资调查也将R列为最高薪的数据科学家使用技能之一。当然,R最吸引人的地方在于它的趣味性,它可以用几行简单的代码生成图表和图以及完成强大的任务功能。如果你选择一门语言作为数据分析入门,我推荐R语言,因为接触后你必将会被它的魅力所吸引。
关于R语言学习,其实并没有快速学习的方法,系统学习、实践运用、独立思考、社区运用是最快速的方法。本文在此推荐一些R语言学习的网站社区、书籍、视频及项目实战资源。

一、推荐几个学习R语言的社区
1.下载安装R语言:(R和R Studio)
http://mirror.bjtu.edu.cn/cran/
www.rstudio.com
2. 帮助你学习和使用R语言的资源:
http://www.ats.ucla.edu/stat/
http://socserv.mcmaster.ca/jfox/Courses/R/Peking/index.html
3.社区帮助
丨R自带的帮助文档
丨Google,善用英文搜索
丨http://Stackoverflow.com牛人聚集,99.9%的R问题都可以在上面找到你想要的答案;
丨R Mailing List:https://stat.ethz.ch/mailman/listinfo/r-help;


二、R语言学习书籍
系统学习一门语言的方法当然是阅读。
1.初级入门
《153分钟学会R》。首先推荐刘思喆的这本书,收集了R初学者提问频率最高的153个问题,可以快速读完。读完这本书,对R也就有了初步感性的认识。
《An Introduction to R》。官方的入门小册子,中文译名为《R导论》。这本书结构比较完整,通过阅读和学习可以很好地搭建R的知识架构。
《R in action》,中文译名为《R语言实战》。有了一定的基础之后,要去读一些经典书籍慢慢开始上手。这本书从R的下载安装手把手带你入门,对R语言实际中使用的基本方法介绍得比较详细精准。读完这本书算是完成基本入门了。
2.高级入门
《Statistics with R》和《The R book》。经典教材。两本书已经不再限于R基础了,而是结合了数据分析的各种常见方法来写就的,比较系统的介绍了R在线性回归方差分析、多元统计、R绘图、时间序列分析、数据挖掘等各方面的内容。
看完之后你会发现,原来R能做的事情这么多,而且做起来是那么简洁。
3.绘图与可视化
《R Graphics Cookbook》,中文书名为《R数据可视化手册》。可视化绘图是R语言的优势。本书是经典的R可视化教程,全面介绍了R中绘图系统。该书对应的有一个网站,google一下就可以了。
《ggplot2:Elegant Graphics for Data Analysis》,中文版译名为《ggplot2:数据分析与图形艺术》。GGplot2被很多人认为是R中最优秀的绘图包。
4.时间序列分析
《Time Series Analysis and Its Applications :with R examples》。中文译名为《时间序列分析及应用:R语言》。
该书介绍了各种时间序列分析的经典方法及实现各种经典方法的R代码。
5.数据挖掘
《Data Mining with R: learing with case studies》(中文版译名《R数据分析:方法与案例详解》)。数据挖掘方面的书并不多,不过,R中数据挖掘方面的包已经足够多了,参考包中的帮助文档就足够了。

三、R语言学习视频推荐
1.CDA.CN新开设CDA公开课栏目,旨在传播数据分析、大数据领域知识与智慧,力求为爱学习的学员创造一个公开的免费课程平台
R语言数据分析:https://www.cda.cn/gkk/1.html
2.Coursera公开课:https://www.coursera.org/
推荐约翰.霍普金大学的数据科学系列课程:《数据科学家的工具箱》、《R语言程序开发》、《探索性数据分析》、《统计推断》《回归模型》、《数据产品开发》

四、项目实战
读万卷书,不如行万里路。如果你的知识储备和R语言编程能力已经足够,想进一步提升的最好方法就是参与项目实践或者竞赛、实习。
1.www.kaggle.com (数据挖掘竞赛网站,有实战的项目和数据可供下载训练,实力强的也可以去挑战高额奖金,同时已经结束的竞赛有前三名的代码和报告可供下载学习)
2.CDA举办的竞赛,阿里巴巴算法天池算法大赛等;

当然,如果你面临自学太慢而无人指导,资源太多而无从选择,独自学习而无人交流,初学数据分析而缺乏入门经验。CDA给你提供了一个便捷入门的方式和平台。
CDA数据分析师结合国内外行业领先师资力量和企业一同精心设计了R语言数据分析课程,采用市场上最受欢迎的统计分析工具R语言,通过丰富、实际的教学内容,帮你为数据分析师职位做好准备!

【课程信息】
北京&远程:2017年2月25~3月19日(周末8天)
授课安排:现场班6900元,远程班4900元
(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式
(2) 授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑) 
(3) 学习期限:现场与视频结合,长期学习加练习答疑。

【报名流程】
1.在线填写报名信息
官网端:https://www.cda.cn/kecheng/43.html
微信端:

2. 给予反馈,确认报名信息
3. 网上缴费
4. 开课前一周发送电子版课件和教室路线图

【课程大纲】
第一阶段:数据分析概念与R编程
1.商业数据分析的本质
2.R介绍、R与RStudio安装
3.R语言编程与数据整合
4.R基本数据类型
5.R基本数据结构
6.R程序控制
7.函数与包
8.数据合并与规整

第二阶段:数理统计与SQL数据库
1.R语言编程与数据整合
2.SQL关系型数据库基本概念
3.SQL语言与R SQL实现
4.描述性统计分析特征选取
5.描述统计与探索数据分析
6.APPLY函数族
7.R基础绘图包
a.案例:畅销品分析
b.案例:产品销售情况指标分析

第三阶段:数理统计与数据可视化
1.描述性统计分析特征选取
2.GGplot2绘图介绍
3.使用SQL进行数据汇总
4.统计推断基础
5.假设检验与单样本T检验
6.两样本T检验
7.方差分析
a.案例:产品销售情况指标展现
b.案例:房价影响因素分析

第四阶段:统计推断与精益管理
1.统计推断基础
2.相关分析、卡方检验
3.简单线性回归
4.精益化管理
5.Dashboard 设计与应用
6.特设分析(Ad Hoc Analysis)
7.对比测试(A/B testing)
a.案例:基于宏观经济指标的产品产量预测模型
b.案例:注册方式对客户转化率的影响

第五阶段:市场分析方法与模式识别模型
1.市场调研与数据采集方法
2.连续变量间关系探索与压缩
3.聚类分析(客户分群)
4.对应分析与多维尺度
a.案例:信贷综合打分
b.案例:各地经济发展数据分析

第六阶段:客户分析方法与分类模型
1.线性回归介绍
2.线性回归诊断
3.分类变量分析
a.案例:信用卡客户价值预测
b.案例:电信客户流失预测

第七阶段:时间序列与综合案例
1.时间序列的定义
2.指数平滑法
3.时间序列模型ARIMA方法
4.信用卡产能预测案例
5.营销效果评估
6.某品牌香烟市场调研案例
7.业务数据分析师课程总结
a.案例:人口数据预测
b.案例:航空公司客运量预测

【联系我们】
电话:010-68411404
手机:18010006628(陈老师)QQ:28819897092881989709  
         13001066694(张老师)QQ:28819897102881989710  
邮箱:cwj@cda.cn
        zm@cda.cn
—— Join Learn!

完 谢谢观看

分享
收藏

OK