michelle.qin

2020-07-24   阅读量: 897

数据分析师 统计学

<复习>统计学 Day1 - part 1

扫码加入数据分析学习群

统计学:一门收集、处理、分析、解释数据并从中得出结论的科学。

【步骤】

收集数据→处理数据→分析数据→解释数据

抓取 清洗 方法:两大类

爬数 (1)描述性分析方法

(2)推断性分析方法①估计

②假设检验

1、数据

(1)形式:

①数字:严格的数字上的符号

②文字:不可运算

核心区别:是否可以运算

(2)按计量尺度不同分类

①分类型

②顺序型(分类型中的一份子)

③数值型

Tips:①与②是文字型,又叫定性数据/品质数据;③是数值型,又叫定量数据,精确定位。

image.png

【结论】

①区间(分组的数值型数据)属于数值型;

②不同类型数据之间可以进行转换(高级→低级,反之不行);

③一个重要的规律:低级方法高级可以用,但高级方法低级不可用

☆方法:人提出来的。

(3)其他分类:

①按来源:直接来源和间接来源;

②按收集方式:观测的数据和实验的数据;

③按与时间的关系:截面数据、时间序列数据、混合数据(面板数据);

④特殊:虚拟变量数据


2、总体和样本

(1)总体:研究的所有元素的集合,每个元素成为个体;

(2)样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目成为样本容量;

样本推断总体。


3、参数和统计量

(1)参数:研究者想要了解的总体的某种特征值;

【e.g.】总体均值()、标准差()、总体比例(π)

(2)统计量:根据样本数据计算出来的一个量,即样本的某个特征值;

【e.g.】样本均值()、样本标准差(s)、样本比例(p)


4、变量

定义:指描述事物某种特征的概念。

【e.g.】商品销售额、受教育程度

变量的具体表现成为变量值,即数据。

分类:

①分类变量:说明事物类别的一个名称;

②顺序变量:说明事物有序类别的一个名称;

③数值型变量:说明事物数字特征的一个名称;

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
25.5490 4 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子