cda

数字化人才认证

首页 > 行业图谱 >

R语言-回归分析笔记
2016-06-02
R语言-回归分析笔记 使用若干自变量并建立公式,以预测目标变量 目标变量是连续型的,则称其为回归分析 (1)一元线性回归分析 y=kx+b sol.lm<-lm(y~x,data) abline(sol.lm) 使模型误差的平方和 ...

 R语言 绘制K线图

R语言绘制K线图
2016-06-01
R语言绘制K线图 K线图是200多年前日本人发明的,后来传入了美国。K线图本来就是对当前数据的可视化显示而已,但是越来越多的人对K线图做出了痴迷的分析和解读,有众多追随者也根据K线图指导自己的具体行动,因 ...

 R语言 处理缺失数据的高级方法

R语言处理缺失数据的高级方法
2016-05-28
R语言处理缺失数据的高级方法 主要用到VIM和mice包 install.packages(c(\"VIM\",\"mice\")) 1.处理缺失值的步骤 步骤: (1)识别缺失数据; (2)检查导致数据缺失的原因; (3)删除包含缺 ...

数据分析师的利器: R语言

数据分析师的利器:R语言
2016-05-26
数据分析师的利器:R语言 近年来,随着大数据浪潮的到来,数据科学快速发展,数据分析师要处理的数据问题越来越复杂,传统的数据分析工具越来越显得力不从心。        R语言作为国外 ...

 R语言 与分类算法的绩效评估

R语言与分类算法的绩效评估
2016-05-18
R语言与分类算法的绩效评估 关于分类算法我们之前也讨论过了KNN、决策树、naivebayes、SVM、ANN、logistic回归。关于这么多的分类算法,我们自然需要考虑谁的表现更加的优秀。 既然要对分类算法进行评价,那 ...

 R语言 数据可视化概述(基于ggplot2)

R语言数据可视化概述(基于ggplot2)
2016-05-17
R语言数据可视化概述(基于ggplot2) ggplot2是R语言最为强大的作图软件包,强于其自成一派的数据可视化理念。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。 本文主要对ggplot2的可视 ...

 R语言 数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)
2016-05-05
R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图) 数据分布图简介 中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻: ...

 R语言 的高质量图形渲染库Cairo

R语言的高质量图形渲染库Cairo
2016-04-11
R语言的高质量图形渲染库Cairo R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在 ...
浅析R语言的优势和缺点
2016-03-30
浅析R语言的优势和缺点 R编程语言在数据分析与机器学习领域已经成为一款重要的工具。随着机器逐步成为愈发核心的数据生成器,该语言的人气也必然会一路攀升。不过R语言当然也拥有着自己的优势与缺点,开发人员 ...

 R语言 与机器学习(分类算法)支持向量机

R语言与机器学习(分类算法)支持向量机
2016-03-26
R语言与机器学习(分类算法)支持向量机 说到支持向量机,必须要提到july大神的《支持向量机通俗导论》,个人感觉再怎么写也不可能写得比他更好的了。这也正如青莲居士见到崔颢的黄鹤楼后也只能叹“此处有景道 ...

 R语言 中大型数据集的回归

R语言中大型数据集的回归
2016-03-12
R语言中大型数据集的回归 众所周知,R语言是一个依赖于内存的软件,就是说一般情况下,数据集都会被整个地复制到内存之中再被处理。对于小型或者中型的数据集,这样处理当然没有什么问题。但是对于大型的数据集 ...
R语言-RJDBC连接Teradata
2016-02-28
R语言-RJDBC连接Teradata 第一步:从Teradata官方网站现在JDBC driver 第二步:把Driver放在一个目录下(我放在C:\\JDBC) 第三步:为R按照RJDBC package install.packages(\"RJDBC\") 安装成 ...

大数据工具比较- R语言 和Spark谁更强

大数据工具比较-R语言和Spark谁更强
2016-02-20
大数据工具比较-R语言和Spark谁更强 现如今的大数据工具真是多,在数据分析师工作中,使用哪些工具更加合适呢,r语言和Spark机器学习那个中有市场率更高些,那个在运算中更快更强些呢? Spark的机器学习库 ...
R语言自定义启动环境
2016-02-17
R语言自定义启动环境 刚做数据分析师时,很多分析软件应用的不是很好,就拿R语言来说吧,平时做R语言开发时,每次启动R语言环境都会要加载很多package,甚是繁琐。最近学习《R in action》时,介绍了自定义R语 ...

 R语言 单元变量的数据可视化方法

R语言单元变量的数据可视化方法
2016-02-17
R语言单元变量的数据可视化方法 Uni-variate data  一元变量的数据分析方法 点图dot plot与抖动图jitter plot 当点都重叠在一起的时候,为了更直观分析数据分布情况,可以把点适当抖动到一定位置(适量的 ...
R语言进行数据分析:方差分析模型
2016-01-23
用R语言进行数据分析:方差分析模型 方差分析和模型比较 模型拟合函数aov(formula, data=data.frame)和函数lm()非常的相似,在Generic functions for extracting model information 部分列出的泛型函数同样 ...
R语言进行数据分析:包
2016-01-18
用R语言进行数据分析:包 数据分析师在做数据分析时,会用到很多技术,R语言是数据分析师必不可少的分析工具,下面我们就对如何用用R语言进行数据分析:包。所有的 R 函数和数据集是保存在(packages)里面的 ...
选择R语言做统计分析的理由
2016-01-13
R语言是S语言的一种开源实现,一种用于数据分析和图形化的编程环境。资深分析师Catherine最近撰文结合自己的实践经验详细介绍了R语言的优点和缺点。 Catherine指出,R主要用于做统计工作。你可以把它看成是像SA ...

  R语言  基本数据分析

R语言 基本数据分析
2016-01-13
本文基于R语言进行基本数据统计分析,包括基本作图,线性拟合,逻辑回归,bootstrap采样和Anova方差分析的实现及应用。 不多说,直接上代码,代码中有注释。 1. 基本作图(盒图,qq图) #basic pl ...

做数据分析必须学 R语言 的4个理由

做数据分析必须学R语言的4个理由
2016-01-05
做数据分析必须学R语言的4个理由 R 是一种灵活的编程语言,专为促进探索性数据分析、经典统计学测试和高级图形学而设计。R 拥有丰富的、仍在不断扩大的数据包库,处于统计学、数据分析和数据挖掘发展的前沿。R ...

OK