田齐齐

python定义变量的时候,前面不用定义数据类型吗?

问题:python定义变量的时候,前面没有数据类型吗?就这样 int a =1;前面不加数据类型吗? 答:Python不用去声明函数的返回类型,是由于其“若类型”的语言特性决定的。python是一种解释型语言,当你定义了一个变量时,解释器自动完成对变量内存的分配,不需要我们自己去定义类型。

田齐齐

2020-03-02

5.3407 2 4
  • 关注作者
  • 收藏

单因素方差分析和独立样本T检验有什么差别

方差分析是3组及以上, 独立样本T检验是两组的差异 都需要方差齐和正态性

田齐齐

2020-03-01

0.0058 1 1
  • 关注作者
  • 收藏

单样本t检验和独立样本t检验的区别

单样本T检验:检验个体与总体均值是否显著差异。假设有三个等级A,B,C。B级均分80,方差,标准误都很小,这样的话如果某人成绩很高或很低,比如95或65,与均分显著差异,那么该个体有理由被调整到A级或C级。 独立样本T检验:检验两个总体均值是否显著差异。假设有两个班A,B。A班均分80,B班均分90,问两个班学生水平是否有显著性差异。独立样本T检验还需验证方差是否齐性,SPSS会直接输出。

田齐齐

2020-03-01

0.0058 1 2
  • 关注作者
  • 收藏

SPSS:F检验为什么要求各比较组的方差齐性?

之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。 在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处

田齐齐

2020-03-01

0.0058 1 0
  • 关注作者
  • 收藏

SPSS:方差齐性检验的原理

齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p>0.05则齐,这与方差分析均数时F越大约好相反。 方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数) 标准差=方差的平方根(s) F=MS组间/MS误差=(处理因素的影响 个体差异带来的误差)/个体差异带来的误差

田齐齐

2020-03-01

0.0058 1 2
  • 关注作者
  • 收藏

打开jupyter notebook无法跳转到浏览器

显示如下: a 方法一:复制红框内网址到谷歌浏览器完成跳转。 方法二:更改默认浏览器。更改方法见链接:(https://blog.csdn.net/weixin_43751243/article/details/104260134)。

田齐齐

2020-03-01

0.0058 1 1
  • 关注作者
  • 收藏

对右偏的数据进行对数变换

将右偏的数据进行对数变换会把右偏的数据专成接近正态,建模不会受到影响。

田齐齐

2020-02-29

0.0058 1 3
  • 关注作者
  • 收藏

将数据归一化映射到另一区间

ymax要映射的目标区间最大值 ymin要映射的目标区间最小值 xmax目前数据最大值 xmin目前数据最小值 x假设目前数据中的任一值 y归一化映射后的值

田齐齐

2020-02-28

0.0058 1 2
  • 关注作者
  • 收藏

标准化后系数解读也发生变化了吧?

是的标准化后x每变化一个标准差,y变化的标准差就是x前面的贝塔。

田齐齐

2020-02-28

0.0058 1 3
  • 关注作者
  • 收藏

序列的随机性分析

平稳序列的随机性分析:ARMA(p,q)自回归移动平均模型。 非平稳序列的随机性分析:ARIMA(p,d,q)和ARIMA(p,d,q)(P,D,Q) 。

田齐齐

2020-02-28

0.0058 1 1
  • 关注作者
  • 收藏

自相关与偏自相关

对于平稳序列yt ,对于任意整数h,cov(yt ,yt h)=E(yt −E(yt))(yt h −E(yt)),则 自相关 p(h) = cov(yt , yt h ) / cov(yt , yt 0 ) 。不过自相关系数可能包含了其他滞后序列间的 影响,因此有必要引入偏自相关的概念。 偏自相关:在控制了其他序列的影响后,两个序列的条件相关性。

田齐齐

2020-02-28

0.0026 1 3
  • 关注作者
  • 收藏

预测类模型怎么解读系数和预测出来的东西?

时间序列模型重点在于预测而不在于归因,所以基本不用去解读预测模型的系数,这个系数几乎不会带来什么商业价值。 预测出来的东西就是我们模型预测出来的值,比如下一个阶段的收益率等。

田齐齐

2020-02-28

0.0000 0 4
  • 关注作者
  • 收藏

时间序列季节性与非季节性是如何判断呢?

通过散点图看图形有没有周期问题。

田齐齐

2020-02-28

0.0000 0 3
  • 关注作者
  • 收藏

构建时间序列模型时需要加截距项吗?

答:模型构建时都会自动携带截距项。

田齐齐

2020-02-28

0.0058 1 2
  • 关注作者
  • 收藏

长期预测与短期预测的分界点是多少呢?

一般把两到三个点的预测称为短期预测,再长的称为长期预测。

田齐齐

2020-02-28

0.0023 1 2
  • 关注作者
  • 收藏

线性回归中出现残差不服从正态分布、异方差、内生性,该怎么调优

不服从正态分布:取对数 异方差:取对数或加权最小二乘 内生性:选择合理的x

田齐齐

2020-02-28

0.0023 1 4
  • 关注作者
  • 收藏

聚类的话50-100行数据做的话有意义吗?

具体要结合问题场景,一般小数据很少用聚类, 如果是用抽样后的小数据来表示大数据的问题,进行分组,也可以。

田齐齐

2020-02-28

0.0023 1 3
  • 关注作者
  • 收藏

聚类后会不会某一个客户不包含在任何一类呢?

问:聚类后每一位客户他对应的特征情况就会放入一类,会不会出现某一个客户不包含在任何一类呢? 答:这个一般不会的,因为聚类分析就是对行进行分组,是对所有行进行聚类分组,这个客户所在的这个组里一定包含他了。

田齐齐

2020-02-28

0.0023 1 1
  • 关注作者
  • 收藏

聚类是除了y以外所有x都投入里面吗?

需要结合公司业务情况,常用的字段尽量都投入。 客户画像的X尽量不要通过模型就行筛选,更多的是结合实际业务。

田齐齐

2020-02-28

0.0023 1 3
  • 关注作者
  • 收藏

聚类分析得到的聚类质量没有超过0.5,如何对模型进行调优?

1.填补缺失值 2.异常值处理 2.筛选更合理的x

田齐齐

2020-02-28

0.0023 1 4
  • 关注作者
  • 收藏
<110111220>