问、什么是相关分析 ? 答: 用于衡量两类现象在发展变化的方向与大小方面存在一定的关联(不包括因果和共变关系)。 类型:有线性相关和非线性相关两种。 一般情况下,如果不做特殊说明,指的就是线性相关。 积差相关公式:
dreamhappy2012
2019-06-20
问、mysql在已经存在的表添加新的列? 答: alter table <表名> add<新列名><数据类型>[约束条件][FIRST|AFTER已存在列名];
dreamhappy2012
2019-06-18
问、myqsl中常用的流程控制语句有哪些? 答: ·IF语句 ·CASE语句 ·WHLE循环语句 ·LOOP循环语句 · REPEAT循环语句
dreamhappy2012
2019-06-17
问、mysql为变量赋值 答: 定义变量之后,通过赋值可以改变变量的 两种赋值方式 SET var name expr [,var_name=expr]…; SELECT col_name[...] INTO varnamel.. table_expr; ·举例 SET nun=100; Select store into num from bookinfo; 案例:根据图书D查询,查询书名和库
dreamhappy2012
2019-06-17
问、mysql定义变量 答: 语法格式:DECLARE var_name, varname].date type[Default VALUE]; 例:DECLARE num INT DEFAULT 10
dreamhappy2012
2019-06-17
问、几个相关系数的区别 答: 皮尔逊相关系数:一般用来计算两个连续型变量的相关系数。 肯德尔相关系数:一个连续一个分类(最好是定序变量) 斯皮尔曼相关系数:2个变量无论连续还是分类都可以,但斯皮尔曼是非参数的,会损失信息,尽量不用
dreamhappy2012
2019-06-17
问、最小二乘法的解释? 答: 思想:总的误差平方和达到最小 误差的表达式: 总的误差平方和: 最小化S,得到𝛽0、𝛽1 的估值 称为𝛽0、𝛽1 的最小二乘估计
dreamhappy2012
2019-06-17
问、最常用的参数估计方法? 答: 使用已有的数据集,估计出参数𝛽0 和𝛽1 。 找到一条能最好地拟合(自变量,因变量)散点图中的点的直线 常用方法: 最小二乘法
dreamhappy2012
2019-06-17
问、拟合方法有哪些? 答: 使用数据估计模型参数时所使用的方法: 1) 最大似然估计法 • 常用方法,但有争议 2) 最小二乘法 • 常用方法 • 数据需满足一定假设条件
dreamhappy2012
2019-06-17
问、高斯马尔科夫假定 答: 1. 线性于参数 2. 随机抽样 3. 不存在完全共线性 4. 误差的条件均值为零 5. 误差的同方差性 6. 误差的正态性
dreamhappy2012
2019-06-17
问、什么是离中趋势? 答: 1.数据分布的另一个重要特征 2.反映各变量值远离其中心值的程度(离散程度) 3.从另一个侧面说明了集中趋势测度值的代表程度 4.不同类型的数据有不同的离散程度测度值
dreamhappy2012
2019-06-14
问、众数、中位数、平均数的特点和应用 答: 1. 众数 • 不受极端值影响 • 具有不惟一性 • 数据分布偏斜程度较大且有明显峰值时应用 2. 中位数 • 不受极端值影响 • 数据分布偏斜程度较大时应用 3. 平均数 • 易受极端值影响 • 数学性质优良 • 数据对称分布或接近对称分布时应用
dreamhappy2012
2019-06-14
问、什么是几何平均数(geometric mean)? 答: 1. n 个变量值乘积的n 次方根 2. 适用于对比率数据的平均 3. 主要用于 4. 计算公式为 5. 可看作是平均数的一种变形
dreamhappy2012
2019-06-14
问、简单平均数(Simple mean)定义? 答: 设一组数据为:x1 ,x2 ,… ,xn (总体数据xN)
dreamhappy2012
2019-06-14
问、什么是平均数(mean)? 答: 1. 也称为均值 2. 集中趋势的最常用测度值 3. 一组数据的均衡点所在 3. 体现了数据的必然性特征 4. 易受极端值的影响 5. 有简单平均数和加权平均数之分
dreamhappy2012
2019-06-14
问、什么是中位数(median)? 答: 1.排序后处于中间位置上的值 50% 2. 不受极端值的影响(重要) 3. 主要用于顺序数据,也可用数值型数据,但不能用于分类数据 4. 各变量值与中位数的离差绝对值之和最小,即
dreamhappy2012
2019-06-14
问、什么是众数(mode)? 答: 1. 一组数据中出现次数最多的变量值,适合于数据量较多时使用 2. 不受极端值的影响 3. 一组数据可能没有众数或有几个众数 4. 主要用于分类数据,也可用于顺序数据和数值型数据
dreamhappy2012
2019-06-14