京公网安备 11010802034615号
经营许可证编号:京B2-20210330
小白学数据分析--相关分析在充值与购买失衡分析的应
昨天简单的说过充值记录的分析方法,今天介绍一下使用相关分析,说说充值与购买的数据相关分析。在很多类型的游戏中,我们经常会做累计充值活动,然而并不是所有的累计充值活动都做的很好,而且某些类型的游戏不适合频繁作累计充值活动,究其原因,其中之一就是会造成充值与购买的失衡,通俗的说就是会存在持币待购的情况,我们希望正常或者良性的循环是充值购买为1:1,这点对于平衡消费,稳定消费结构很重要,当然了实际运营中我们也会面临很多的突发因素,比如游戏内容调整,游戏数值调整,版本IB刺激等等。但是如果出现持币待购也就是说充值远远大于购买时,我们就需要警惕和分析原因。
但是我们如何来判定和量化持币待购的情况?这里我们将采用相关分析的方法来解决。所谓相关分析(Correlation Analysis)是考察两个变量的相互变化的关系程度,与回归分析不同的是,相关分析的两个变量地位是平等的,不存在因果关系。相关关系是变量之间保持某种不确定的依存关系,相关分析可以借助散点图或者诸如相关系数来考察变量间的关联程度。
变量的相关关系按照两者的变动分为正相关和负相关,正相关也就是相关系数为正,两个因素同方向变动,一个增大另一个也增大,而负相关就是相关系数为负,两个因素按照反方向变动,一个增大另一个却反而减小。
按照相关的程度来看,相关关系可以分为完全相关、不相关和不完全相关。当一个变量变化完全由另一个变量决定时,这种关系为完全相关;如果彼此互不影响,变量各自独立,就是不相关;而两个变量之间关系介于完全相关和不相关之间就是不完全相关。
关于描述相关系数的方法有很多种,这里不再讲解,一般而言我们比较关注相关分析按照影响因素(变量)如何确定分析方法,对于我们今天讨论的充值购买的相关分析就是双变量相关分析,即通过计算两个变量之间的相关系数,对两个变量之间是否显著相关做出判断。另外还有偏相关分析,当出现多个变量时,直接对两个变量进行相关分析往往不能真实反映二者之间的相关关系,这时就需要用偏相关分析,剔出其他变量的线性影响。最后一种是距离分析,当出现了多个变量而不能每个分析解决时,此时将所有的变量按照一定的标准分类,即聚类分析。
相关分析在Excel和SPSS中均有相关的模块可用于分析,今天说说在Excel中怎么使用相关分析,在Excel中判断相关关系的方法有两种,即散点图和相关关系分析工具。散点图这里就不再累述了,简单说说相关关系分析工具的使用。
首先在Excel中把数据分析模块调用出来,点击开始,选择Excel选项

选择加载项|分析工具库|转到

之后打开如下的对话框,选择分析工具库,点击确定,最后会在数据标签下出现数据分析的加载项。

随后选择数据分析|相关系数,出现相关系数对话框。在输入区域需要输入分析数据区域的单元格引用,且引用数据区域必须是两个或者以上的行或者列的相邻数据区域。这里我们选取某一月的每名玩家的充值总额和该月相应的购买总额。
分组方式是数据区域是按照行或者列排列,单击逐行或者逐列。
标志位于第一行/标志位于第一列,如果输入区域的第一行显示变量名,选中标志位于第一行,列的形式一样。如果输入区域没有变量,无需选择。
之后会输出一个相关分析结果的表格,该表格会把两个变量的相关系数计算出来,根据计算的系数就能够了解充值总额和购买总额的相关系数。相关系数一般会呈现两种结果。
正相关:随着充值总额的增加,购买总额也增加,此时充值和购买的平衡保持较稳(当然这种分析不是绝对的,不要只限于用这一种方法就断言充值购买的平衡性,还要结合其他数据来看待,切忌)
负相关:随着充值的增加,购买反而减少,呈反向变化趋势,此时为充值购买不平衡的情况出现,可以作为一个参考指标。
p.s.做这种相关分析要注意维度的把握,比如是新登玩家、回流玩家等等,可以更加明确的分析和把握客群特点,因为在APA群体中,发生充值购买失衡不一定是整个的APA群体,不断地细分APA客群,可以更好地进行分析。进而当我们找到了充值购买失衡最为严重的APA群体后,在通过聚类分析、RFM分析等更加深刻描述和分析问题。这是一个系列的过程,相关性的分析只是在第一步把充值购买的失衡问题暴露出来,这只是一种手段,但不是唯一。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11