登录
首页精彩阅读资深数据分析师和您聊聊手游的数据分析这点事
资深数据分析师和您聊聊手游的数据分析这点事
2016-10-20
收藏

资深数据分析师和您聊聊手游的数据分析这点事

在互联网的各个时代,“数据”对于从业者来讲一直是“富者不嫌,穷者不弃”的东西。究其原因是因为通过数据往往能够集中对于本公司产品或者当前的市场现状做出一个相对客观和直观的反馈,而根据这些数据则有助于从业者对于本公司或者公司旗下产品的下一步调整做出参考。

而对于移动游戏从业者来说,对于数据的依赖同样存在。除去根据后台数据对于本公司产品进行分析以及公开的行业数据报告进行趋势预测外,通过对外晒本公司产品的留存,付费率等数据,也是一种移动游戏行业比较常见的PR手法。

但是,在这个人人都在谈数据,并对数据见怪不怪的时代。对于数据的分析与解读应该如何进行?却并不是每个从业者都明白的话题,对于数据的分析应该如何进行?而数据分析的关键点又在哪里?如何能够最大限度的体现出数据的价值? 带着这些问题,龙虎豹在近日拜访了业内知名的数据分析机构TalkingData,并通过与其资深分析师、市场智能部高级总监陶京琪的沟通,为游戏行业的从业者在数据分析过程中能够提供一些有价值的方法与帮助。

为阅读方便,本文以陶京琪自述形式展开:

为什么要做数据分析

在开始这个话题之前,我想先从数据的意义和目的聊起。

在TalkingData内部,我们有一句口号是“用数据说话”。意思是所有的东西都要用数据来表现,因为数据本质上还是一种能够相对的对于要研究的话题进行客观呈现的东西。但是真正能够彻底明白“让数据说话”这句话意思的人却不多。

什么是“让数据说话”呢?在我看来最重要的就是发挥数据的价值,那怎么让数据发挥价值呢?其实这就牵扯到了当前行业里数据报告普遍存在的问题。我今天还经常看一些报告,不管是移动互联网的还是游戏行业的,我发现这里面有个最大的问题是,我们的数据报告往往还停留在五年前最基础的数据统计方面,而这样的报告所能呈现出的结果未必是我们想得到的。在这方面我觉得TalkingData还是比别人多走了一步的,我们每年的报告都可以比去年多做一些东西。

那么这些报告缺一些什么呢?在我看来可能就是分析与解读,这两方面是做数据比较关键的点。因为每一项数据样本其实都能够反应一样东西,关键在于你去如何分析和解读它。

举例来讲我曾经看见过一些游戏行业里常见的“晒留存”的数据新闻,这些数据也许在公布时有一些不完善(究竟哪些不完善我会在后面说明),但总得来讲它仍然提供了一种解读方式,并且从其目的出发仍不失为体现了数据的价值,只不过这种价值可能更多的局限于PR。但归根结底,对于企业来讲,它的确是产生了价值的。

事实上这就是数据产生的意义,你要做的是学会解读和分析它。那接下来,我就来聊聊怎么做数据分析?

数据分析的前提

刚才在一开始的时候,我曾经提到过一点就是今天的很多数据报告还停留在五年前,最基础的数据统计方面,谈不上什么分析与解读。作为CP与发行商来说,我认为这种分析你是应该杜绝的,这也就牵扯到了我们接下来说的一个话题——数据分析的前提。

我认为作为CP与发行商来说,你是这个行业里一线的从业者,因此你在做数据分析之前的时候目的一定是明确的:什么是目的呢?就是你心里明白你为什么要去做这个数据分析?在你心里是带有一个问题的,这个问题不管是就整个行业的趋势来说还是就你的产品出现的某一问题来说都是一样的。而做数据分析的目的其实就是验证你发现的问题是否是存在的。

这话听起来像是废话,但实际上它却决定了你的下一步行动。在我们看来数据解读不能就数据解读数据,而一定是要结合行业里的某一个现象看的,毕竟数据是能够比较直观地反应出一个现象的。在这种情况下,你心里有一个明确的目的和你没有目的做出的分析与解读是完全不同的。

接下来,我就聊聊数据分析的三个过程。

首先:预判与筛选,明确你的目的是关键

前文说过,作为数据分析来说,你不能就数据说数据,更不能把所有的数据进行简单的汇总。因此在第一步做数据分析之前,你要做的是预判。

预判对于数据分析来说极为重要,前文说过数据分析与解读的前提一定是为了解决某一问题而存在的。也正因此,预判在这个环节中所起到的作用就提出假设。说得通俗点就是:“要解决问题,先要证明问题。”

这一步看似简单,但实际是异常重要。这是因为今天的移动游戏运营是一件复杂与多元化的事情。也正因此,为证明问题的存在要通过多个不同纬度的数据来进行。而预判这个环节也正是为此而存在,它决定的其实是根据你提出的问题而去提取哪个纬度的数据。

举例来讲,2015年之后,移动电竞概念开始出现,市场上打“移动电竞”牌的产品越来越多。那么这一领域的市场是否就此进入了一个强增长周期,这个时候我就可以做出类似的预判,而后去筛选出多组数据。

比如说证明移动电竞市场将处于强增长周期,那么我首先要看的是市场环境,这其中用户数量是一个纬度,其次还有CP数量、产品数量、在往后还有收入规模等等一系列的东西。通过这些纬度数据的筛选和提取,最后的结果我才能加以分析,并且得出一个结论是或者否。当然说提取数据和分析都是之后的事情,在这一步中我们要做的仅仅是提出问题,而后根据问题在去找到几个相关的纬度。

对于移动游戏的发行商或者CP来说,根据自己所面对的问题,提出的问题是可大或可小的,重要的是与自己当前面对的问题息息相关,但并不因为问题较为明显而使得在随后筛选数据纬度时也因此而简单。

举例来讲,某些CP在游戏上线一段时间之后会认为自己的游戏已经处于增长乏力期,那么这时他提出了一个明显的问题:我的游戏是否处于增长乏力期难以后继。这时表面看起来简单,只要提取过去一个周期内新进用户的数量即可。但实际上刚才我们说过游戏运营往往是一个多元化导致的最终结果,因此你还要看游戏的收入规模是否也因此而走缓?你的用户流失在过往的几个月里是怎样的?你的竞品数据是否在这一周期有了提升?

以及再往上的,你这个产品所处的领域是否收入也呈一样的趋势?通过这一系列多元化的数据筛选,最终你才能得出一个结论是这个游戏是否真的是增长乏力?还是并非增长乏力而是用户流失过多?亦或是因为整个细分领域的遇冷使得你的产品也被连带。你需要做的就是用这个问题去找到相关的纬度,而后在去筛选提取数据。

但我需要在此声明的一点是:作为预判这个环节来说,它仅限于“解决某一问题”时存在,对于一些行业趋势性的预测是不存在这一环节的。其理由在于趋势性的东西往往是通过数据直观反应出来的,因此如果真的是预测行业中的某一趋势的话,则应该做的是直接进入筛选环节,通过多个纬度去提取数据。

接下来是提数据:加权处理这一刀砍在哪

预判与筛选这一步完成之后,接下来要做的事情就是按照划分的纬度提取数据。在很多人看来这一步过后就可以直接进入数据分析的环节,但事实上这其中仍有一个加权处理即对数据进行加工的过程。

为什么要进行数据的加工?在很多人看来,原始的数据往往是最能够显示问题的根本的,但是作为分析师,我想说的是生活在移动互联网的大数据时代,你要做的绝对不是把所有的数据汇总在桌上就可以了。如果你真这么做了你会发现自己根本无法找到想要的数据。为什么这么说呢?因为在大数据时代下是有一些过于零散的“脏数据”的,如果你一味地将之进行汇总的话,那么毫无疑问它会把你的数据线带偏。

举个不够恰当的例子,你想针对于iOS排行榜上的应用去做一次用户付费分析。那你最后会发现在一万名之后仍然存在着许多小的、不为人知的应用APP,这些应用APP,它们的使用行为过于零散,但是汇总到一起之后仍然是可观的数量,最后的结果就是它可能会把你原本的数据线带跑,使你对于数据的曲线产生一定的怀疑。而对于数据的加工,其实就是为了避免这种现象。你要把一些过于零散的数据砍掉。

那么如何去砍这一刀呢?这其实与第一个问题预测和筛选息息相关。你要明白你提取数据是干什么的?并且你要研究的问题是什么?在搞清楚这件事情之后,剩下的事就是把数据中那些不到1%的体量的小概率数据给砍掉。

在TalkingData我们是这么处理这个问题的。假设我要分析的是付费用户相关的数据,那我会先去提数据,其次根据数据计算体量。一般来讲,头部数据一定是占绝大多数的比例,那剩下的事我就要根据我研究的问题以及整个的数据体量去设置这一刀砍在哪。研究问题不同,最后这一刀的设置也不一样。

总得来讲,从你研究问题的角度出发,随后去根据行业、平均值以及主体数据量来设定这一刀卡在哪个位置,这个位置之下的全部数据都砍掉。

对于CP或者发行商来说,在这个过程中比较容易犯的问题是突然间忽略了自己要研究的课题。举例来讲CP或者发行商要研究的是游戏的主要付费用户的某一项行为,那么你就要记住你的主体是什么,至少应该是个小R,而小R之下还有很多更小额的付费用户,其付费呈碎片化就整体的付费金额来说根本构不成比例。

但这时有的CP就想了,这是活跃用户呀?也是很有参考价值的。这样想倒没错,但你要明白的一点是,在这里你的研究主体是“主要付费用户”,那这些用户也许是活跃用户不假,但他并不符合这个主体,最后的结果就是只能把你的曲线带偏。最后结果我觉得你真因此做出错误的反馈大R用户走了,也不是你想要的。

当然就数据的加权处理这事来说,这其实是一个挺复杂的过程。砍掉脏数据仅仅是其中的一部分,限于篇幅不在此多说。但这一步应该是每一个想做分析的CP或者发行都需要了解的,最起码你是要利用数据得出结论,而不是说被数据带着跑。那样的话就失去数据分析的本意了。

分析与解读:你能正确解读出数据反应出的问题吗

在开始这一部分的时候我首先要明确一点。那就是对于数据来说,分析与解读的含义是不同的。具体来说分析主要是就数据说数据,而解读则是就行业说数据。基于这一观点来说,对于今天的CP与发行商来说,其实更需要的是后者。

我曾经见过有一些CP或者发行商,问题也提出了,纬度也找了,数据也提了,但最后的结果是经过分析没有得出任何有价值的结果。在我看来其实这都是在解读这一环节做得不够。解读这事咱们前面说过,一定是就行业或者是某一问题说数据的。因此你最首先需要对于某项数据对应的指标要有一个大概的了解,其次就是你应该把这个数据结合到整个行业的高度去看,而不是单纯地看一个数据。

举个最简单的例子,CP或者发行商发现新增放缓了如临大敌,但在这种情况下你参考的数据纬度可能都是正确的,但是你是否把它与行业结合了,并且充分地把你的公司模型放在这个行业里了?有的时候你的产品已经推出三个季度甚至快一年了,那有可能产品就是进入了稳定期,它的新增在这种情况就是放缓了。

其次不在这个稳定期的话,你是否应该看看你做了什么推广活动?别家的企业做了什么推广活动?用户的需求一定是不断流动的,在这种情况下我认为你是需要进行一个对比的。其次就是对于很多CP来说要学会摆正自己的位置。王健林说得好,先定一个可以实现的小目标,作为CP来讲也是一样,目标不要定得太大。你别先把自己的某项数据单纯和市场上的头部产品比较。

所以就这个环节来说,表面上来看只要根据数据做一个汇总就可以了,但其实真正考验的是你的解读功力,即将数据与行业、与自己的企业和产品充分在市场上对接的能力。说到这我想多说两句关于之前提的一点,就是行业里常见的发行商和CP晒数据的行为。其实这样的行为目的,一是给自己发声和曝光,第二则是通过这种方式引发渠道的注意能够获得更好的位置,而一些渠道也会对此另眼相看。

但这里有一个问题仍然在于对这份数据的解读。这些数据在我看来一个比较明显的问题就是,它没有把自己的数据提取环境与样本等相关的东西说清楚。举例来讲有的游戏说自己付费率100%,但根据我们的理解可能行业里付费超过50%都很困难。但有可能是这家CP的游戏是一个点卡制收费的游戏,那在这种情况下他说100%的付费率的确是没有错的。

不过这里有一个问题就是对于发行也罢,还是渠道也罢,都需要对于数据有进一步的解读能力。举例来讲你看一个游戏首测数据不错,次留是60%以上,那我觉得你还应该看看其它的数据,比如说一个时间周期的新增、留存以及付费,然后其次是背景信息,包括题材、类型,以及这个题材和这个类型之下真正的“市场尾灯”是谁,通过这些综合的信息对于这些产品在市场上的前景得出一个大致的结论。这些纬度我觉得都是应该你去看的,当然就这块来说我认为渠道或者发行作为实操者肯定比我更有经验,因此我就不在这班门弄斧了。

数据分析咨询请扫描二维码

客服在线
立即咨询