首页 > 行业图谱 >

- 利用R语言如何判别和分类
2018-01-21
-
利用R语言如何判别和分类
判别分析(discriminant analysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。
...

- R之组间差异的非参数检验
2018-01-18
-
R之组间差异的非参数检验
# t 检验
# 在研究中最常见的行为就是对两个组进行比较。接受某种新药治疗的患者是否较使用某种现
# 有药物的患者表现出了更大程度的改善?某种制造工艺是否较另外一种工艺制造出的不 ...

- R语言与回归分析几个假设的检验
2018-01-14
-
R语言与回归分析几个假设的检验
一、从线性回归的假设说起
对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫条 ...

- 主成分分析、因子分析、聚类的概览与比较
2018-01-12
-
主成分分析、因子分析、聚类的概览与比较
主成分分析:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),用综合指标来解释多变量的方差——协方差结构,即每个主 ...

- 主成分分析和因子分析十大不同点
2018-01-11
-
主成分分析和因子分析十大不同点
主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。
1.原理不同
主成分 ...

- Python数据分析常用函数笔记
2018-01-10
-
Python数据分析常用函数笔记
1、生成随机数列表
import numpy as np
array = np.random.permutation(20)
结果:
array([12, 18, 16, 8, 10, 17, 1, 2, 9, 7, 3, 6, 15, 13, 11, 5, 4, 0, 14, 19])
2、合并两个p ...

- SPSS—描述性统计分析—频数分析
2018-01-09
-
SPSS—描述性统计分析—频数分析
描述性统计量
分类
集中趋势分析——中心趋势的数值度量
反映一组数据向某一位置聚集的趋势,主要的统计量有均数(mean)、中位数(median)、众数(mode)、总 ...

- 数据科学的基本内容
2018-01-08
-
数据科学的基本内容
什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...
- 朴素贝叶斯模型:文本分类+垃圾邮件分类
2017-12-10
-
朴素贝叶斯模型:文本分类+垃圾邮件分类
学习了那么多机器学习模型,一切都是为了实践,动手自己写写这些模型的实现对自己很有帮助的,坚持,共勉。本文主要致力于总结贝叶斯实战中程序代码的实现(python)及朴 ...

- 数据缺失值的4种处理方法
2017-12-06
-
数据缺失值的4种处理方法
一、缺失值产生的原因
缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器 ...

- 我们进行了1亿次婚恋配对实验,然后……
2017-12-05
-
我们进行了1亿次婚恋配对实验,然后……
“要求别太高,差不多就行了。”
“找个有钱人嫁了吧!”
“感情不能将就,一定要找合适的。”
……
这些说法有没有道理呢?按照这些“标准”,是不是有更 ...

- 数据挖掘中针对缺失值的处理
2017-12-01
-
数据挖掘中针对缺失值的处理
一、缺失值产生的原因
缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储 ...

- 数据分析中缺失值的处理方法
2017-11-23
-
数据分析中缺失值的处理方法
1、缺失值的分类
按照数据缺失机制可分为:
(1) 完全随机缺失(missing completely at random, MCAR)
所缺失的数据发生的概率既与已观察到的数据无关,也 ...

- SPSS混合模型:线性混合模型
2017-11-08
-
SPSS混合模型:线性混合模型
一、线性混合模型(分析-混合模型-线性)
1、概念:“线性混合模型”过程扩展了一般线性模型,因此允许数据表现出相关的和不恒定的变异性。因此,线性混合模型提供了不仅能够就 ...

- SPSS最优尺度:分类主成分分析
2017-11-05
-
SPSS最优尺度:分类主成分分析
一、分类主成分分析(分析-降维-最优尺度)
1、概念:此过程在减少数据维数的同时量化分类变量。分类主成份分析也表示为缩写词CATPCA(代表categorical principal co ...

- R语言中的方差分析
2017-11-01
-
R语言中的方差分析
方差分析:当包含的因子是解释变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析法称作方差分析(ANOVA)。
install.packages(c(\'multcomp\', \'gplots\', \'car\', \'HH ...

- 单因素下的方差分析
2017-10-31
-
单因素下的方差分析
在方差分析中,有三个基本的假设:
(1) 正态假设。对于因素的每个水平,其观测值都是来自正态总体的随机样本;
(2) 方差齐次假设。各个总体的方差相同;
(3) 独立假设。 ...

- SPSS—均 值 检 验 (Compare Means)—配对样本T检验
2017-10-30
-
SPSS—均 值 检 验 (Compare Means)—配对样本T检验
用来检验来自两配对总体的均值是否在统计上有显著差异
配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资 ...

- SPSS—描述性统计分析—比率分析
2017-10-30
-
SPSS—描述性统计分析—探索性分析
菜单
除了可以计算基本的统计量之外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。使得用户能够从大量的分析结果之中挖掘到所需要的统计信息。
...

- SPSS干货分享:区分T检验与F检验
2017-10-28
-
SPSS干货分享:区分T检验与F检验
1. T 检验和 F 检验的由来
一般而言,为了确定从样本 (sample) 统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。
通过把所得 ...