京公网安备 11010802034615号
经营许可证编号:京B2-20210330
小白学数据分析--相关分析在充值与购买失衡分析的应
昨天简单的说过充值记录的分析方法,今天介绍一下使用相关分析,说说充值与购买的数据相关分析。在很多类型的游戏中,我们经常会做累计充值活动,然而并不是所有的累计充值活动都做的很好,而且某些类型的游戏不适合频繁作累计充值活动,究其原因,其中之一就是会造成充值与购买的失衡,通俗的说就是会存在持币待购的情况,我们希望正常或者良性的循环是充值购买为1:1,这点对于平衡消费,稳定消费结构很重要,当然了实际运营中我们也会面临很多的突发因素,比如游戏内容调整,游戏数值调整,版本IB刺激等等。但是如果出现持币待购也就是说充值远远大于购买时,我们就需要警惕和分析原因。
但是我们如何来判定和量化持币待购的情况?这里我们将采用相关分析的方法来解决。所谓相关分析(Correlation Analysis)是考察两个变量的相互变化的关系程度,与回归分析不同的是,相关分析的两个变量地位是平等的,不存在因果关系。相关关系是变量之间保持某种不确定的依存关系,相关分析可以借助散点图或者诸如相关系数来考察变量间的关联程度。
变量的相关关系按照两者的变动分为正相关和负相关,正相关也就是相关系数为正,两个因素同方向变动,一个增大另一个也增大,而负相关就是相关系数为负,两个因素按照反方向变动,一个增大另一个却反而减小。
按照相关的程度来看,相关关系可以分为完全相关、不相关和不完全相关。当一个变量变化完全由另一个变量决定时,这种关系为完全相关;如果彼此互不影响,变量各自独立,就是不相关;而两个变量之间关系介于完全相关和不相关之间就是不完全相关。
关于描述相关系数的方法有很多种,这里不再讲解,一般而言我们比较关注相关分析按照影响因素(变量)如何确定分析方法,对于我们今天讨论的充值购买的相关分析就是双变量相关分析,即通过计算两个变量之间的相关系数,对两个变量之间是否显著相关做出判断。另外还有偏相关分析,当出现多个变量时,直接对两个变量进行相关分析往往不能真实反映二者之间的相关关系,这时就需要用偏相关分析,剔出其他变量的线性影响。最后一种是距离分析,当出现了多个变量而不能每个分析解决时,此时将所有的变量按照一定的标准分类,即聚类分析。
相关分析在Excel和SPSS中均有相关的模块可用于分析,今天说说在Excel中怎么使用相关分析,在Excel中判断相关关系的方法有两种,即散点图和相关关系分析工具。散点图这里就不再累述了,简单说说相关关系分析工具的使用。
首先在Excel中把数据分析模块调用出来,点击开始,选择Excel选项

选择加载项|分析工具库|转到

之后打开如下的对话框,选择分析工具库,点击确定,最后会在数据标签下出现数据分析的加载项。

随后选择数据分析|相关系数,出现相关系数对话框。在输入区域需要输入分析数据区域的单元格引用,且引用数据区域必须是两个或者以上的行或者列的相邻数据区域。这里我们选取某一月的每名玩家的充值总额和该月相应的购买总额。
分组方式是数据区域是按照行或者列排列,单击逐行或者逐列。
标志位于第一行/标志位于第一列,如果输入区域的第一行显示变量名,选中标志位于第一行,列的形式一样。如果输入区域没有变量,无需选择。
之后会输出一个相关分析结果的表格,该表格会把两个变量的相关系数计算出来,根据计算的系数就能够了解充值总额和购买总额的相关系数。相关系数一般会呈现两种结果。
正相关:随着充值总额的增加,购买总额也增加,此时充值和购买的平衡保持较稳(当然这种分析不是绝对的,不要只限于用这一种方法就断言充值购买的平衡性,还要结合其他数据来看待,切忌)
负相关:随着充值的增加,购买反而减少,呈反向变化趋势,此时为充值购买不平衡的情况出现,可以作为一个参考指标。
p.s.做这种相关分析要注意维度的把握,比如是新登玩家、回流玩家等等,可以更加明确的分析和把握客群特点,因为在APA群体中,发生充值购买失衡不一定是整个的APA群体,不断地细分APA客群,可以更好地进行分析。进而当我们找到了充值购买失衡最为严重的APA群体后,在通过聚类分析、RFM分析等更加深刻描述和分析问题。这是一个系列的过程,相关性的分析只是在第一步把充值购买的失衡问题暴露出来,这只是一种手段,但不是唯一。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18