登录
首页精彩阅读如何做好数据分析让运营效率提高100倍
如何做好数据分析让运营效率提高100倍
2015-12-14
收藏

如何做好数据分析让运营效率提高100倍


大家好,今天跟大家分享一些做互联网产品的一些心得,特别是数据分析方面的心得体会、还有一些教训和经验。



1、第一个故事


我先跟大家分享两个故事。第一个故事是关于“中国股票研究中心”的故事。故事是这样的,1月2号的时候,有一个人叫Peter,Peter收到一封来自“中国股票研究中心”的邮件,向他表示这个月市场会上涨。结果市场果然上涨,前段时间股票不错,很多人不知道在座的大家有多少买过股票。然后Peter收到这封邮件的时候,他不是很在意,因为大家都知道所谓的元月效应这回事,即好几年来都是一月份的股价涨的多。到了2月1号的时候,他又收到另外一封邮件,向他表示市场即将下跌,这一次,那封信又给说中了!Peter现在终于开始相信这个研究中心真的是有点水平。3月1号的时候,Peter又收到一封信,情形还是一样的。


Peter觉得很神奇,他主动联系对方,希望下个月还能收到同样的邮件,过了一个月,4月1号邮件如期而至,但这时候这个研究中心表示,前几封邮件预测太准了,结果引起了证监会的高度重视,他们以后不能再像以前那样大规模的免费发送邮件了,只能对少数有见识的VIP客户提供投资建议,而你是非常幸运的一名,获得了有限的100个VIP购买资格。


你是怎么看待这个“中国股票研究中心”呢?


A、这个肯定是有内幕的,否则怎么可能预测得这么准呢?


B、世界上什么样的人物都有,估计真的是预测水平高吧。


C、不知道怎么回事,既然这么准,要不买个VIP资格试试吧!


连续几次收到这样的邮件,我觉得要是换作在座的任何一个人,估计都会很心动。真实的情况是这样的,这个所谓的“中国股票研究中心”,他向市场上的非特定对象群发了大概1000封的邮件,然后把这1000封里面分为2组,一组是说告诉他接下来股票会涨,另一组告诉他会跌,每次发送的时候,总有一半的人是收到预测是准的邮件,而另一半的人可能就收到预测是错误的邮件。接下来循环同样发送几次之后,可能每次连续几次总有几个人收到的邮件是始终预测正确的,而Peter就是那个始终预测正确中的一个用户。


这样的案例可能大家在其他地方也看到过。他告诉我们一个道理,即在数据分析中你有时候会看到一些数据很稳定地朝一个方向变化,并不一定代表着真相就是这样的。


2第二个故事


第二个故事,这个故事发生在二战时候。英国,当时盟军跟德军在英国上空进行了惨烈的空战。但是发现空战的结果是盟军受到很大的损失,所以盟军就希望在自己的战斗机上增加一些装甲保护,但是大家都知道飞机的装甲是不可能无限制的加的,因为装甲越多,飞机一定是飞得越慢,然后耗油量越大。于是,空军就请来一些专业的统计学家、数学家,一起来分析看看能从现有的飞机的数据上看看在那些部位增加装甲是最划算的。


这个故事的主人公沃德教授就跟空军一起来到了维修基地,大家做了一轮统计下来之后,发现所有盟军正在维修基地中维修的轰炸机的机翼上,弹孔是分布的最多。但是发动机舱跟驾驶员座舱的弹孔数是最少的。于是,空军就比较倾向于希望能够加强机翼部分的装甲。在这个时候统计学家就有了跟那个空军完全不一样的看法,沃德教授就建议,他觉得应该是加强飞行员座舱跟发动机舱的装甲,因为那里发现的弹孔最少。


如果是你,你是同意沃德教授的看法呢还是同意空军的看法?我给出的答案是说我同意统计学家的看法,因为这里涉及到我们数据分析中的一个“幸存者偏差”。大家可以看到,虽然我们统计下来是那个机翼上中弹是最多的,但是实际上大家不要忘了这里我们所选取的样本并不是所有参与战斗任务的所有的轰炸机,而只是在维修基地中这些能够幸存下来的飞机。实际上我们在战斗过程中大量损失的飞机并没有在这个维修基地中出现,可能在空中就爆炸了或者怎样。


统计学上把这个叫做“幸存者偏差”。因为我们在分析数据样本的时候,只关注那些幸存者的数据。所以这个故事也告诉我们一个道理,做数据分析中选择样本是非常重要的。你如果只看到幸存者的样本,导出来的数据跟结论就是有偏差的。


前面讲的这几个案例可能跟我们的互联网产品工作都相差比较远。但是,统计分析的道理不仅是在我们的产品设计中有用,实际上在我们工作生活的方方面面,我们只要带着数据分析的思维,很多情况下都是非常实用的。


3、如何判断竞争对手数据的真实性?


接下来继续讲一个跟我们产品分析工作比较相近的一个案例,是一个关于情报分析的一个案例。这个案例的对象是一个比较有名的视频网站。这个网站在财报中披露到他们网站当年的高清视频服务的收入1.2亿,月均活跃付费的用户超过70万人。我们怎么确定财报中的这些数据是真实的呢?大家在平时在工作中也会经常遇到各种各样的数据,听到各种各样的八卦数据,到底是不是真实的呢?比如说,大家经常会听到说那个什么什么APP,它的最近的活跃又有多少啦,注册用户又有多少,每天新增多少用户啦,或者什么什么产品的订单数最近又有多少啦,这些数据我们是可以通过一些其他的方法来校验这是不是真实的。


我们就讲这个现在要分析的这个视频网站的案例。我们经过对他的网站进行研究之后,发现他的会员频道,这个视频网站的包月会员频道上有一个栏目,叫做新增会员。连续24小时,每隔一到两分钟,我们就把这个网页刷新一下,并且截图,然后把所有出现的用户名录入这个表格。


大家可以看PPT上的这样一个样本,我们把这些东西都记下来,然后把这些东西整理成一个Excel表。这个案例是几年前的一个案例,当时是在公司内分享,大家可以看一下,其实道理都是类似的。我当时是12年的时候,3月29号,这个是当时在网络上一个报道取下来的一个东西,就是3月29号的时候,这个报道中的记者,做了一个连续24小时的监测,从当天早上的九点到第二天早上的九点,取了这么多数据之后,我们会发现,这些数据是非常完整的,也 就是说这些数据有极少量的有断点存在。比如说这次刷新的最后一名,刚好是下一次刷新的第一名,那就是连续的,没有断点的。

数据分析咨询请扫描二维码

客服在线
立即咨询