首页 > 行业图谱 >

- R语言:数据库SQL-R连接与SQL语句执行(RODBC、sqldf包)
2017-04-29
-
R语言:数据库SQL-R连接与SQL语句执行(RODBC、sqldf包)
数据库是极其重要的R语言数据导入源数据之地,读入包有sqldf、RODBC等。跟SQL server相连有RODBC,跟MySQL链接的有RMySQL。但是在R里面,回传文本会出 ...

- R语言:集合运算—小而美法则
2017-04-29
-
R语言:集合运算—小而美法则
集合运算的一般规则如下:
union(x,y) #求并集
intersect(x,y) #求交集
setdiff ...

- R语言:数据规范化、归一化
2017-04-29
-
R语言:数据规范化、归一化
笔者寄语:规范化主要是因为数据受着单位的影响较大,需要进行量纲化。大致有:最小-最大规范化、均值标准化、小数定标规范化
数据中心化和标准化的意义是一样的,为了消除量纲对数 ...

- R语言:异常值检验、离群点分析、异常值处理
2017-04-29
-
R语言:异常值检验、离群点分析、异常值处理
笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值)
异常值处理 ...

- R语言中如何使用最小二乘法
2017-04-28
-
R语言中如何使用最小二乘法
这里只是介绍下R语言中如何使用最小二乘法解决一次函数的线性回归问题。
代码如下:
> x<-c(6.19,2.51,7.29,7.01,5.7,2.66,3.98, ...

- R语言基因组数据分析可能会用到的data.table函数整理
2017-04-28
-
R语言基因组数据分析可能会用到的data.table函数整理
R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。包括两个方面,一方面是写的快,代码简洁,只要一行命令就可以完 ...

- R语言:数据去重
2017-04-25
-
R语言:数据去重
查看重复的方式,有点像分类变量个数一样,unique() 或者 table() 都是很好的方式去检测。
1、unique函数
[plain] view plain copy
print?在CODE上查看代码片派生到我的代码片
& ...

- R语言:基本函数、统计量、常用操作函数
2017-04-25
-
R语言:基本函数、统计量、常用操作函数
先言:R语言常用界面操作
帮助:help(nnet) = ?nnet =??nnet
清除命令框中所有显示内容:Ctrl+L
清除R空间中内存变量:rm(list=ls())、gc()
获取或者设置当前工作目录 ...

- R语言:构造新序列
2017-04-25
-
R语言:构造新序列
1、数值构造函数rep与seq
[plain] view plain copy
print?在CODE上查看代码片派生到我的代码片
#数值构造rep与seq
rep(1:4,each=2)#依次重复 ...

- R语言:排序问题
2017-04-25
-
R语言:排序问题
数据排序
1、sort(),rank(),order()函数
Sort
排序(默认升序,decreasing=T时为降序)
Order
排序(默认升序,decreasing=T时为降序)
在R中,和排序相关的函数主要有三个:sort(),rank() ...

- R语言︱用excel VBA把xlsx批量转化为csv格式
2017-04-23
-
R语言︱用excel VBA把xlsx批量转化为csv格式
在上面的尝试已经发现,xlsx本身就是这个复杂问题的最根本原因。与之相反,R对csv等文本格式支持的很好,而且有fread这个神器,要处理一定量级的数据,还是得把xlsx ...

- R语言函数收藏||字符串处理-grep/grepl/sub/gsub
2017-04-21
-
R语言函数收藏||字符串处理-grep/grepl/sub/gsub
处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要 ...
- R语言处理大规模数据集的编程要点
2017-04-21
-
R语言处理大规模数据集的编程要点
1.提高程序效率,保证执行速度
(1)尽量使用向量化运算
(2)尽量使用矩阵,必要时才使用数据框
(3)使用read.table时,尽量显式设定colClasses和nrows,设定comment.cha ...

- R语言各种假设检验实例整理
2017-04-21
-
一、正态分布参数检验
例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下:
159 280 101 212 224 379 179 264
&n ...

- 如何使用R语言解决可恶的脏数据
2017-04-21
-
如何使用R语言解决可恶的脏数据
在数据分析过程中最头疼的应该是如何应付脏数据,脏数据的存在将会对后期的建模、挖掘等工作造成严重的错误,所以必须谨慎的处理那些脏数据。
脏数据的存在形式主要有如下几种 ...

- R语言与格式、日期格式、格式转化
2017-04-20
-
R语言与格式、日期格式、格式转化
R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它不包括时间和时区信息,另一类是POSIXct/POSIXlt类型数据,其中包括了日期、时间和时区信息。基本总结如下 ...

- R语言中plyr包
2017-04-20
-
R语言中plyr包
apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例 ...

- R语言数据集合并、数据增减、不等长合并
2017-04-20
-
R语言数据集合并、数据增减、不等长合并
数据选取与简单操作:
一、数据合并
1、merge()函数
最常用merge()函数,但是这个函数使用时候这两种情况需要注意:
1、merge(a,b),纯粹地把两个数据集 ...

- R语言之文本挖掘--分词
2017-04-20
-
R语言之文本挖掘--分词
当前对文本挖掘的需求越来越多,而基于文本挖掘又可以实现舆情监控、文本分类、关联分析和趋势预测等。
本文主要使用李舰发布的中文分词包Rwordseg。该包引用了@ansj开发的ansj中文 ...

- 业务数据分析师-R语言首次公开课
2022-01-20
-
好消息!CDA1级业务数据分析师-R语言举行公开课了!这是一场纯干货的直播!重要的事情现在只说一遍,机不可失!下面是详情安排:
一、直播话题
数据科学与R语言编程入门
二、报名方式
...