首页 > 行业图谱 >
- CDA LEVEL I 数据分析认证考试模拟题库(十三)
- 2020-12-28
-
嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL I的模拟试题时间了,今天给大家带来的是模拟试题(一)中的61-65题。
不过,在出题前,要公布下上一期56-60题的答案,大家一起来看!
56、B
57、B
...
- CDA LEVEL I 数据分析认证考试模拟题库(二)
- 2020-12-10
-
今天,我们继续给大家出关于CDA LEVEL I 数据分析认证考试模拟题库中的5题,不过在出题前,我们还要公布下上一期题目的正确答案。
1、D
2、C
3、B
4、D
5、A
大家都答对了吗?做题过程中有 ...
- spss-重复测量方差分析
- 2018-08-11
-
spss-重复测量方差分析
重复测量方差分析是由不同时间点上对同一个对象的同一个观察指标进行多次测量所得。
研究目的是观察处理因素随时间变化的趋势。
缺点是存在顺序效应(处理因素的排列先后可能会有 ...
- 差异表达与聚类分析
- 2018-06-09
-
差异表达与聚类分析
在鉴定出ncRNA后,我们如何推断其可能的生物学功能呢?首先对于miRNA等作用机制比较清楚的ncRNA,我们可以参考其作用机制,利用碱基互补等方式预测其靶标,并进而推断其生物学功能。然而,对 ...
- 聚类分析中分类数的确定问题
- 2018-06-05
-
聚类分析中分类数的确定问题
聚类的目的是为了分类,但到底分多少类合适呢?迄今为止它上没有得到完全解决。
Demirmen曾提出根据树状结构图来分类的准则:
1.任何类都必须在临近类中是突出的 ...
- 从线性回归到无监督学习,数据科学家需要掌握的十大统
- 2018-06-02
-
从线性回归到无监督学习,数据科学家需要掌握的十大统
不管你对数据科学持什么态度,都不可能忽略分析、组织和梳理数据的重要性。Glassdoor 网站根据大量雇主和员工的反馈数据制作了「美国最好的
25
个职位」 ...
- 利用Python代码实现数据可视化的5种方法详解
- 2018-04-20
-
利用Python代码实现数据可视化的5种方法详解
数据科学家并不逊色于艺术家。他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解。更有趣的是,一旦接触到任何可视化的内容、数据时,人类 ...
- R语言简单操作,数值与向量
- 2018-03-15
-
R语言简单操作,数值与向量
1 向量与赋值
R对命名了的数据结构进行操作。最简单的数据结构是数字向量;如,
> x <- c(10.4, 5.6, 3.1, 6.4, 21.7) c()是创建函数,赋值运算符是\'<-\',与函数a ...
- Python使用三种方法实现PCA算法
- 2018-01-23
-
Python使用三种方法实现PCA算法
主成分分析,即Principal Component
Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域。它的主要作用是对高维数据进行降维。PCA把原先的n个特征用数 ...
- 数据挖掘十大经典算法之K最近邻算法
- 2018-01-02
-
数据挖掘十大经典算法之K最近邻算法
k-最近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。
基于实例的学习
1.已知一系列的训练样例,很多学习 ...
- 如何实现降维处理(R语言)
- 2017-12-07
-
如何实现降维处理(R语言)
现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加 ...
- SPSS回归分析:有序回归
- 2017-11-21
-
SPSS回归分析:有序回归
一、概念(分析-回归-有序)
使用序数回归可以在一组预测变量(可以是因子或协变量)上对多歧分序数响应的依赖性进行建模。序数回归的设计基于McCullagh (1980, 1998)的方 ...
- SPSS广义线性模型:广义估计方程
- 2017-11-08
-
SPSS广义线性模型:广义估计方程
一、广义估计方程:
1、概念:广义估计方程过程对广义线性模型进行了扩展,以允许分析重复的测量或其他相关观察数据,例如聚类数据。
2、示例。公共卫生官员 ...
- 数据科学的基本内容
- 2017-10-31
-
数据科学的基本内容
什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...
- 一个优雅地探索相关性的新可视化方法
- 2017-08-27
-
一个优雅地探索相关性的新可视化方法
一个古老的诅咒一直萦绕着数据分析:我们用来改进模型的变量越多,那么我们需要的数据就会出现指数级的增长。不过,我们通过关注重要的变量就可以避免欠拟合以及降低收集 ...
- 机器学习中的各种相似性、距离度量
- 2017-07-25
-
机器学习中的各种相似性、距离度量
本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。
1. 闵可夫斯基距离
基本认识
该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...
- R语言与回归分析几个假设的检验
- 2017-07-22
-
R语言与回归分析几个假设的检验
一、从线性回归的假设说起
对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫 ...
- R语言多元分析系列
- 2017-07-21
-
R语言多元分析系列
R语言多元分析系列之一:主成分分析
主成分分析(principal components analysis,
PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...
- R语言判别分析
- 2017-07-19
-
R语言判别分析
本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参 ...
- R语言因子分析
- 2017-07-18
-
R语言因子分析
因子模型: X=μ + A*F* + ε
其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。
I.参数估计
为了建立因子模型,需要要 ...