CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

SPSS常见函数及使用方法

SPSS常见函数及使用方法
2017-02-27
SPSS常见函数及使用方法 SPSS函数是一个常用程序,并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称(keywordname),且绝不能写错。 通常,函数的格式为:函数名称(自变量,自变量 ...

R语言中离群值的识别、描述、绘制与移除

R语言中离群值的识别、描述、绘制与移除
2017-02-26
R语言中离群值的识别、描述、绘制与移除 统计学中离群值被定义为离开大部分观测较远的样本点,多数是由于测量误差而产生。因此,数据分析中离群值的识别和移除(如有必要)是很重要的一个步骤。 鉴 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2017-02-26
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户 ...

使用R进行倾向得分匹配(PSM)

使用R进行倾向得分匹配(PSM)
2017-02-26
使用R进行倾向得分匹配(PSM) 根据维基百科,倾向得分匹配(PSM)是一种用来评估处置效应的统计方法。广义说来,它将样本根据其特性分类,而不同类样本间的差异就可以看作处置效应的无偏估计。因此,PSM不仅 ...

PageRank算法R语言实现

PageRank算法R语言实现
2017-02-26
PageRank算法R语言实现 Google搜索,早已成为我每天必用的工具,无数次惊叹它搜索结果的准确性。同时,我也在做Google的SEO,推广自己的博客。经过几个月尝试,我的博客PR到2了,外链也有几万个了。总结下来, ...

R语言解读一元线性回归模型

R语言解读一元线性回归模型
2017-02-26
R语言解读一元线性回归模型 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长 ...

用R语言建立学生的学习表现和性格特征数据模型

用R语言建立学生的学习表现和性格特征数据模型
2017-02-26
用R语言建立学生的学习表现和性格特征数据模型 一、项目介绍: 方法包括以下步骤 S1:将个体表现数据输入到数据库; S2:建立学习者的学习表现数据库和性格特征数据库; S3:建立学习者的学习表现 ...

用R语言作社群关系分析

用R语言作社群关系分析
2017-02-25
用R语言作社群关系分析 在反映大量人群或事物之间的关系时,社交网络图可以清晰的展示’群体’的内含和外延。例如,群体的规模、核心、与其他群体的交叠情况。 社交关系图来表示应用人数和之间的交叠关系, ...

使用R原生函数来做文本挖掘

使用R原生函数来做文本挖掘
2017-02-25
使用R原生函数来做文本挖掘 最近有几位同学问到我如何利用tm包做文本挖掘,比较抱歉的是时间不太充足,不能完整更新文档。 在这里只好给大家一些tips,来利用R的原生函数来完成文本挖掘的核心步骤。 set ...

简单的认识一下组合分类器以及R语言对应使用函数

简单的认识一下组合分类器以及R语言对应使用函数
2017-02-25
简单的认识一下组合分类器以及R语言对应使用函数 首先,我们大家都有学习过一系列的分类方法,例如决策树,贝叶斯分类器等,有时候分类的效果不太如人意,哪怕是参数是最优化也一样,所以这时候就需要一些提高 ...

R语言数据预处理

R语言数据预处理
2017-02-25
R语言数据预处理 一、日期时间、字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date(), date(), difftime(), ISOdate(), ...

R语言相关分布函数、统计函数的使用

R语言相关分布函数、统计函数的使用
2017-02-25
R语言相关分布函数、统计函数的使用 R语言相关分布函数、统计函数的使用 分布函数家族: *func() r : 随机分布函数 d : 概率密度函数 p : 累积分布函数 q : 分位数函数 func()表示具体的名称 ...

R语言统计与分布的相关知识

R语言统计与分布的相关知识
2017-02-25
R语言统计与分布的相关知识 变量 变量按变量值是否连续可分为连续变量与离散变量两种。连续变量(continuous variable)与离散变量(discrete variable) 连续变量 在一定区间内可以任意取值的变量叫 ...

使用R进行统计分析--概率计算

使用R进行统计分析--概率计算
2017-02-24
使用R进行统计分析--概率计算 R语言中提供了很多概率函数,可以方便的计算事件发生的概率。如二项分布概率函数和泊松分布概率函数。本篇文章介绍如果使用R语言中的这些函数求解事件发生的概率。 概率函 ...

使用R进行统计分析--假设检验

使用R进行统计分析--假设检验
2017-02-24
使用R进行统计分析--假设检验 假设检验是统计学中的一种推断方法,用来判断两个样本或总体间的差异是由于抽样误差引起的还是本质差别造成的。R语言中提供了很多假设检验函数,如F检验,t检验和卡方检验等等。本 ...

用R语言做网页爬虫和文本分析

用R语言做网页爬虫和文本分析
2017-02-24
用R语言做网页爬虫和文本分析 受到这篇情感分析的文章和这篇网页爬虫指南的双重启发,我决定尝试抓取并分析 Goodreads 网站的书评数据。这个项目将会呈现一个从数据收集到机器学习建模分析的完整案例,我在中途 ...

R语言中的t检验

R语言中的t检验
2017-02-24
R语言中的t检验 问题 在R中,我们如何检验从总体中抽样得到的两组样本是否有不同的均值,或是通过总体中的某一组样本检验总体均值与某一理论均值间的差异。 指南 示例数据 我们选择内置的sleep数据集 ...

R语言的三种聚类方法

R语言的三种聚类方法
2017-02-24
R语言的三种聚类方法 一、层次聚类 1)距离和相似系数 r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离 ...

使用R读取并查看数据

使用R读取并查看数据
2017-02-24
使用R读取并查看数据 本篇文章介绍如何使用R语言读取并查看数据,包含一些最基础的函数使用方法和说明。后面还会陆续介绍数据清洗,匹配和提取等相关的操作。 查看函数帮助 对于新手来说,在使用R时最重 ...

使用R实现一个简单的连续系统模拟

使用R实现一个简单的连续系统模拟
2017-02-23
使用R实现一个简单的连续系统模拟 连续系统就是指状态随着时间连续变化的系统。我们通过计算机模拟对连续系统得到的结果只是近似的,但如果只要这种近似达到了一定的精度,也就可以满足要求。 连续系统模拟的一 ...

OK