CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

数据分析的基本流程和方法

数据分析的基本流程和方法
2017-10-28
数据分析的基本流程和方法 在大数据时代,数据分析的重要性显得更加突出,但是数据分析是一个相对比较专业的领域。数据分析的目的性很强,数据收集、数据处理和数据建模都要围绕数据分析的目的展开;同时数据分 ...

电子商务数据分析的认识

电子商务数据分析的认识
2017-10-28
电子商务数据分析的认识 就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用 数据分析来发现现有的 ...

一次数据分析的全过程

一次数据分析的全过程
2017-10-28
一次数据分析的全过程 刚下完班的时候,在公司无聊的坐着,一位同事拿了一些数据给我,说让我实现一个类似交叉表格的统计报表。 我原以为是最多十几分钟就搞定的事情,没想到花了2个小时,所以印象比较深, ...

Excel/SPSS相关性及显著性水平分析

Excel/SPSS相关性及显著性水平分析
2017-10-28
Excel/SPSS相关性及显著性水平分析 对两列数据的相关性以及显著性水平的问题一直有困扰,由于对excel的钟情,总是倾向于把数据分析放在excel中进行。本文简单分析excel和SPSS对相关分析和显著性水平的检验应用 ...

SPSS干货分享:区分T检验与F检验

SPSS干货分享:区分T检验与F检验
2017-10-28
SPSS干货分享:区分T检验与F检验 1. T 检验和 F 检验的由来 一般而言,为了确定从样本 (sample) 统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得 ...

假设检验中的P值 与显著性水平的联系

假设检验中的P值 与显著性水平的联系
2017-10-27
假设检验中的P值 与显著性水平的联系 假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另 ...

显著性水平 置信度 置信区间 实例讲解

显著性水平 置信度 置信区间 实例讲解
2017-10-27
显著性水平 置信度 置信区间 实例讲解 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。 置信 ...

置信区间、显著性检验和统计学意义

置信区间、显著性检验和统计学意义
2017-10-27
置信区间、显著性检验和统计学意义 置信区间 估计参数真值所在的范围通常以区间的形式给出,同时还给出此区间包含参数真值的可信程度,这种形式的估计称为区间估计,这样的区间称为置信区间。 对于任意参 ...
T检验、F检验和统计学意义(P值或sig值)
2017-10-27
T检验、F检验和统计学意义(P值或sig值) 1.T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所 ...

比较配对设计的SPSS与SAS实现

比较配对设计的SPSS与SAS实现
2017-10-27
比较配对设计的SPSS与SAS实现 配对设计主要研究某种实验处理前后的对比状况,来判定该种处理是否有效。该种方法能够有效地控制非实验因素对结果的影响。 需要注意的是实验前后的结果不是独立的,就是说实验 ...

方差分析--T检验和F检验的异同

方差分析--T检验和F检验的异同
2017-10-26
方差分析--T检验和F检验的异同 最近在图书馆借了本《R和ASReml-R统计分析教程》,林元震和陈晓阳主编的关于R的书籍,当时看上这本书的原因在于里面以统计学知识为主,作为R语言实战的良好补充,虽然R语言实战是 ...

SPSS——方差分析(Analysis of Variance, ANOVA)——多因素方差分析(无重复试验双因素)

SPSS——方差分析(Analysis of Variance, ANOVA)——多因素方差分析(无重复试验双因素)
2017-10-26
SPSS——方差分析(Analysis of Variance, ANOVA)——多因素方差分析(无重复试验双因素) 当遇到两个因素同时影响结果的情况,需要检验是一个因素起作用,还是两个因素都起作用,或者两个因素的影响都不显著 场 ...

双因子方差分析:R中的双因子ANOVA

双因子方差分析:R中的双因子ANOVA
2017-10-26
双因子方差分析:R中的双因子ANOVA 单因子方差分析是验证多个群组均值是否相等的非常有用的技术。但一些更复杂的问题这个技术就无能为力了。例如,有时需要考虑变异的两个因子来决定群组之间的平均依赖于群组分 ...

 Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。

Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。
2017-10-26
Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。 使用Python进行数据分析,数据的可视化是数据分析结果最好的展示方式,这里从Analytic Vidhya中找到的相关数据,进行一系 ...

Python数据可视化:箱线图

Python数据可视化:箱线图
2017-10-26
Python数据可视化:箱线图 一、箱线图概念 箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。 计算过程: (1)计算上四分位数(Q3),中位数,下四 ...

双因素方差分析SPSS实现流程

双因素方差分析SPSS实现流程
2017-10-25
双因素方差分析SPSS实现流程 有一水稻施肥的盆栽试验,设置了5个处理:A1和A2分别施用两种不同工艺流程的氨水,A3施碳酸氢铵,A4施尿素,A5为对照。每个处理各4盆,随机置于同一试验大棚。水稻稻谷产量见下表。 ...

Excel-直方图(频率分布)分析

Excel-直方图(频率分布)分析
2017-10-25
Excel-直方图(频率分布)分析 直方图又称频率分布图,是一种显示数据分布情况的柱形图,即不同数据出现的频率。通过这些高度不同的柱形,可以直观、快速地观察数据的分散程度和中心趋势,从而分析流程满足客户 ...

箱形图以及python实践

箱形图以及python实践
2017-10-25
箱形图以及python实践 最近在接触kaggle的竞赛示例,练习了一下,感觉受益匪浅。同时,心中也有个问题。拿到数据之后第一件事是什么?分析数据的情况?怎么分析?分析之后如何去处理数据呢?等等一些数据分析 ...

Excel-箱线图(数据分布)分析

Excel-箱线图(数据分布)分析
2017-10-25
Excel-箱线图(数据分布)分析 箱线图(Boxplot)也称箱须图(Box-whisker Plot),它是用一组数据中的最小值、第一四分位数、中位数、第三四分位数和最大值来反映数据分布的中心位置和散布范围,可以粗略地看 ...

SPSS—描述性统计分析—探索性分析

SPSS—描述性统计分析—探索性分析
2017-10-24
SPSS—描述性统计分析—探索性分析 菜单 除了可以计算基本的统计量之外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。使得用户能够从大量的分析结果之中挖掘到所需要的统计信息。 ...

OK