CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

使用R写入Excel方法总结

使用R写入Excel方法总结
2017-02-27
使用R写入Excel方法总结 数据部门在和公司其他部门打交道过程中,将数据写入Excel文件经常会涉及到(从各种临时需求到日常数据报告Dashboard等等)。 通过Rdocumentation查询write to excel,会有15个R包、2 ...

SPSS分析技术:描述统计;了解手中的数据,从这里开始

SPSS分析技术:描述统计;了解手中的数据,从这里开始
2017-02-27
SPSS分析技术:描述统计;了解手中的数据,从这里开始 无论是总体数据还是样本数据,描述统计都是了解它们的第一步,因为了解数据是进行进一步数据分析的基础。在统计基础文章中介绍过,描述数据可以从三个维度进 ...

SPSS统计分析案例:对应分析

SPSS统计分析案例:对应分析
2017-02-27
SPSS统计分析案例:对应分析 两个分类变量间的关系,无法直接使用常见的皮尔逊相关系数来表述,多采用频数统计、交叉表卡方检验等过程进行处理,当分类变量的取值较多时,列联表频数的形式就变得更为复杂,很难 ...

SPSS常见函数及使用方法

SPSS常见函数及使用方法
2017-02-27
SPSS常见函数及使用方法 SPSS函数是一个常用程序,并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称(keywordname),且绝不能写错。 通常,函数的格式为:函数名称(自变量,自变量 ...

R语言中离群值的识别、描述、绘制与移除

R语言中离群值的识别、描述、绘制与移除
2017-02-26
R语言中离群值的识别、描述、绘制与移除 统计学中离群值被定义为离开大部分观测较远的样本点,多数是由于测量误差而产生。因此,数据分析中离群值的识别和移除(如有必要)是很重要的一个步骤。 鉴 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2017-02-26
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户 ...

使用R进行倾向得分匹配(PSM)

使用R进行倾向得分匹配(PSM)
2017-02-26
使用R进行倾向得分匹配(PSM) 根据维基百科,倾向得分匹配(PSM)是一种用来评估处置效应的统计方法。广义说来,它将样本根据其特性分类,而不同类样本间的差异就可以看作处置效应的无偏估计。因此,PSM不仅 ...

PageRank算法R语言实现

PageRank算法R语言实现
2017-02-26
PageRank算法R语言实现 Google搜索,早已成为我每天必用的工具,无数次惊叹它搜索结果的准确性。同时,我也在做Google的SEO,推广自己的博客。经过几个月尝试,我的博客PR到2了,外链也有几万个了。总结下来, ...

R语言解读一元线性回归模型

R语言解读一元线性回归模型
2017-02-26
R语言解读一元线性回归模型 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长 ...

用R语言建立学生的学习表现和性格特征数据模型

用R语言建立学生的学习表现和性格特征数据模型
2017-02-26
用R语言建立学生的学习表现和性格特征数据模型 一、项目介绍: 方法包括以下步骤 S1:将个体表现数据输入到数据库; S2:建立学习者的学习表现数据库和性格特征数据库; S3:建立学习者的学习表现 ...

用R语言作社群关系分析

用R语言作社群关系分析
2017-02-25
用R语言作社群关系分析 在反映大量人群或事物之间的关系时,社交网络图可以清晰的展示’群体’的内含和外延。例如,群体的规模、核心、与其他群体的交叠情况。 社交关系图来表示应用人数和之间的交叠关系, ...

使用R原生函数来做文本挖掘

使用R原生函数来做文本挖掘
2017-02-25
使用R原生函数来做文本挖掘 最近有几位同学问到我如何利用tm包做文本挖掘,比较抱歉的是时间不太充足,不能完整更新文档。 在这里只好给大家一些tips,来利用R的原生函数来完成文本挖掘的核心步骤。 set ...

简单的认识一下组合分类器以及R语言对应使用函数

简单的认识一下组合分类器以及R语言对应使用函数
2017-02-25
简单的认识一下组合分类器以及R语言对应使用函数 首先,我们大家都有学习过一系列的分类方法,例如决策树,贝叶斯分类器等,有时候分类的效果不太如人意,哪怕是参数是最优化也一样,所以这时候就需要一些提高 ...

R语言数据预处理

R语言数据预处理
2017-02-25
R语言数据预处理 一、日期时间、字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date(), date(), difftime(), ISOdate(), ...

R语言相关分布函数、统计函数的使用

R语言相关分布函数、统计函数的使用
2017-02-25
R语言相关分布函数、统计函数的使用 R语言相关分布函数、统计函数的使用 分布函数家族: *func() r : 随机分布函数 d : 概率密度函数 p : 累积分布函数 q : 分位数函数 func()表示具体的名称 ...

R语言统计与分布的相关知识

R语言统计与分布的相关知识
2017-02-25
R语言统计与分布的相关知识 变量 变量按变量值是否连续可分为连续变量与离散变量两种。连续变量(continuous variable)与离散变量(discrete variable) 连续变量 在一定区间内可以任意取值的变量叫 ...

使用R进行统计分析--概率计算

使用R进行统计分析--概率计算
2017-02-24
使用R进行统计分析--概率计算 R语言中提供了很多概率函数,可以方便的计算事件发生的概率。如二项分布概率函数和泊松分布概率函数。本篇文章介绍如果使用R语言中的这些函数求解事件发生的概率。 概率函 ...

使用R进行统计分析--假设检验

使用R进行统计分析--假设检验
2017-02-24
使用R进行统计分析--假设检验 假设检验是统计学中的一种推断方法,用来判断两个样本或总体间的差异是由于抽样误差引起的还是本质差别造成的。R语言中提供了很多假设检验函数,如F检验,t检验和卡方检验等等。本 ...

用R语言做网页爬虫和文本分析

用R语言做网页爬虫和文本分析
2017-02-24
用R语言做网页爬虫和文本分析 受到这篇情感分析的文章和这篇网页爬虫指南的双重启发,我决定尝试抓取并分析 Goodreads 网站的书评数据。这个项目将会呈现一个从数据收集到机器学习建模分析的完整案例,我在中途 ...

OK