相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。常见的有线性相关分析、偏相关分析和距离分析。 相关分析与回归分析在实际应用中有密切关系。 然而在回归分析中,所关心的是一个随机变量Y对另一个(或一组)随机变量X的依赖关系的函数形式。而在相关分析中 ,所讨论的变量的地位一样,分析侧重于随机变量之间的种种相关特征
wo5656500
2020-03-13
假设检验:是数理统计学中根据一定假设条件由样本推断总体的一种方法。 具体作法是: 根据问题的需要对所研究的总体作某种假设,记作H0; 选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知; 由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。 常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
wo5656500
2020-03-13
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。目的是描述数据特征,找出数据的基本规律。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。 (1)数据的频数分析:在数据的预处理部分,我们曾经提到利用频数分析和交叉频数分析来检验异常值。此外,频数分析也可以发现一些统计规律。比如说,收入低的被调查者用户满意度比收入高的
wo5656500
2020-03-13
树形分析法 这个树形图中, S表示句子,NP表示名词词组,VP表示动词词组,AP表示形容词词组, NUMER表示数量词组,N 表示名词,V表示动词,CARD表示基数词,QTF表示量词,ADJ表示形容词,PART表示助词,它们都是标记。 树形图由结和连接结的枝组成,每一个结至少有一个标记,也可以有多个标记,其中,有的标记是表示词组类型或词类的,如 S、NP、VP、V、N、PART等,它们不
wo5656500
2020-03-12
R(Recency)最近一次消费时间:表示用户最近一次消费距离现在的时间。消费时间越近的客户价值越大。1年前消费过的用户肯定没有1周前消费过的用户价值大。 F(Frequency)消费频率:消费频率是指用户在统计周期内购买商品的次数,经常购买的用户也就是熟客,价值肯定比偶尔来一次的客户价值大。 M(Monetary)消费金额:消费金额是指用户在统计周期内消费的总金额,体现了消费者为企业创利的多少,
wo5656500
2020-03-12
RFM模型简介 RFM模型大家都很清楚了,该模型的3大要素如下: R:最近一次消费(recency),用户距离当前最后一次消费的时间; F:消费频次(frequency),用户在一段时间内,在产品内的消费频次; M:消费金额(monetary),代表用户的价值贡献; 根据这3个维度,每个维度进行两分,可以得到下表的8类用户: a 上表可以转换成下图的样子,这个也是我们对RFM最熟知的一
wo5656500
2020-03-12