数据科学专业问答社区，好文章，一字千金--CDA答疑社区

CDA数据科学研究院 CDA考试中心 CDA网校企业服务

CDA社区

CDA竞赛 CDA技术答疑 CDA俱乐部

关于CDA APP下载

免密码登录

提交首次登录验证后自动注册

dreamhappy2012

在2018年11月12日加入
点赞能量: 100%
点赞价值: 0

什么是相关分析？

问、什么是相关分析？答：用于衡量两类现象在发展变化的方向与大小方面存在一定的关联（不包括因果和共变关系）。类型：有线性相关和非线性相关两种。一般情况下，如果不做特殊说明，指的就是线性相关。积差相关公式：

dreamhappy2012

2019-06-20

0.0000 0 0

mysql在已经存在的表添加新的列？

问、mysql在已经存在的表添加新的列？答： alter table <表名> add<新列名><数据类型>[约束条件][FIRST|AFTER已存在列名];

dreamhappy2012

2019-06-18

75.0000 1 4

myqsl中常用的流程控制语句有哪些？

问、myqsl中常用的流程控制语句有哪些？答： ·IF语句 ·CASE语句 ·WHLE循环语句 ·LOOP循环语句 · REPEAT循环语句

dreamhappy2012

2019-06-17

0.0000 0 3

mysql为变量赋值

问、mysql为变量赋值答：定义变量之后，通过赋值可以改变变量的两种赋值方式 SET var name expr [,var_name=expr]…; SELECT col_name[...] INTO varnamel.. table_expr; ·举例 SET nun=100; Select store into num from bookinfo; 案例：根据图书D查询,查询书名和库

dreamhappy2012

2019-06-17

23.1844 1 1

mysql定义变量

问、mysql定义变量答：语法格式：DECLARE var_name, varname].date type[Default VALUE]; 例：DECLARE num INT DEFAULT 10

dreamhappy2012

2019-06-17

75.0000 1 3

几个相关系数的区别

问、几个相关系数的区别答：皮尔逊相关系数：一般用来计算两个连续型变量的相关系数。肯德尔相关系数：一个连续一个分类（最好是定序变量）斯皮尔曼相关系数：2个变量无论连续还是分类都可以，但斯皮尔曼是非参数的，会损失信息，尽量不用

dreamhappy2012

2019-06-17

0.0000 0 6

协方差的定义?

dreamhappy2012

2019-06-17

0.0000 0 2

最小二乘回归直线

问、最小二乘回归直线答：最小二乘直线一定存在可能不唯一

dreamhappy2012

2019-06-17

23.1844 1 1

最小二乘法的解释？

问、最小二乘法的解释？答：思想：总的误差平方和达到最小误差的表达式：总的误差平方和：最小化S，得到𝛽0、𝛽1 的估值称为𝛽0、𝛽1 的最小二乘估计

dreamhappy2012

2019-06-17

0.0000 0 3

最常用的参数估计方法？

问、最常用的参数估计方法？答：使用已有的数据集，估计出参数𝛽0 和𝛽1 。找到一条能最好地拟合（自变量，因变量）散点图中的点的直线常用方法：最小二乘法

dreamhappy2012

2019-06-17

0.0000 0 2

拟合方法有哪些？

问、拟合方法有哪些？答：使用数据估计模型参数时所使用的方法： 1) 最大似然估计法 • 常用方法，但有争议 2) 最小二乘法 • 常用方法 • 数据需满足一定假设条件

dreamhappy2012

2019-06-17

23.1844 1 3

高斯马尔科夫假定

问、高斯马尔科夫假定答： 1. 线性于参数 2. 随机抽样 3. 不存在完全共线性 4. 误差的条件均值为零 5. 误差的同方差性 6. 误差的正态性

dreamhappy2012

2019-06-17

0.0000 0 1

什么是离中趋势？

问、什么是离中趋势？答： 1.数据分布的另一个重要特征 2.反映各变量值远离其中心值的程度(离散程度) 3.从另一个侧面说明了集中趋势测度值的代表程度 4.不同类型的数据有不同的离散程度测度值

dreamhappy2012

2019-06-14

0.0000 0 5

众数、中位数、平均数的特点和应用

问、众数、中位数、平均数的特点和应用答： 1. 众数 • 不受极端值影响 • 具有不惟一性 • 数据分布偏斜程度较大且有明显峰值时应用 2. 中位数 • 不受极端值影响 • 数据分布偏斜程度较大时应用 3. 平均数 • 易受极端值影响 • 数学性质优良 • 数据对称分布或接近对称分布时应用

dreamhappy2012

2019-06-14

37.5000 1 6

什么是几何平均数(geometric mean)？

问、什么是几何平均数(geometric mean)？答： 1. n 个变量值乘积的n 次方根 2. 适用于对比率数据的平均 3. 主要用于 4. 计算公式为 5. 可看作是平均数的一种变形

dreamhappy2012

2019-06-14

0.0000 0 0

简单平均数(Simple mean)定义？

问、简单平均数(Simple mean)定义？答：设一组数据为：x1 ，x2 ，… ，xn (总体数据xN)

dreamhappy2012

2019-06-14

0.0000 0 3

什么是平均数(mean)？

问、什么是平均数(mean)？答： 1. 也称为均值 2. 集中趋势的最常用测度值 3. 一组数据的均衡点所在 3. 体现了数据的必然性特征 4. 易受极端值的影响 5. 有简单平均数和加权平均数之分

dreamhappy2012

2019-06-14

37.5000 1 2

什么是四分位数？

问、什么是四分位数？答： 1.排序后处于25%和75%位置上的值 2.不受极端值的影响 3.计算公式

dreamhappy2012

2019-06-14

0.0000 0 7

什么是中位数？

问、什么是中位数(median)？答： 1.排序后处于中间位置上的值 50% 2. 不受极端值的影响（重要） 3. 主要用于顺序数据，也可用数值型数据，但不能用于分类数据 4. 各变量值与中位数的离差绝对值之和最小，即

dreamhappy2012

2019-06-14

0.0000 0 1

什么是众数？

问、什么是众数(mode)？答： 1. 一组数据中出现次数最多的变量值，适合于数据量较多时使用 2. 不受极端值的影响 3. 一组数据可能没有众数或有几个众数 4. 主要用于分类数据，也可用于顺序数据和数值型数据

dreamhappy2012

2019-06-14

37.5000 1 3

<1…8910…44>