大数据的反面大数据不能做什么-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读大数据的反面大数据不能做什么

大数据的反面大数据不能做什么

2017-04-20

大数据的反面大数据不能做什么

人们对大数据寄予了许多的希望：卖出更多的货物，做出更好的产品，找到更酷的朋友，甚至帮我们决定明天早上是否睡个懒觉。现在，凡是有信息流通的地方，都有人们对大数据的期望。

大数据果真如此神通吗?大数据不能做什么?下面从几个方面来谈谈大数据的反面。

一、大数据不能对具体行为作出精确预测

事实上，人们的社会行为具有不可预测性。甚至我们不妨可以定性地归成一个大数据测不准原理：人和事件，如果放到越大的空间和时间范围，则是越可以精确预测的;如果放到越小的空间和时间范围，则是越不可以精确预测的。

举个例子说：我们几乎可以在100%的程度上预测一个人24小时的范围内会吃饭，但若精确到某一分钟，则几乎不可能预测准确。进一步我们会发现，利用更多过去一段时间的数据，能够帮助我们提高预测某半个小时内是否吃饭的几率，但如果把时间精确到某一分钟，则更多的数据几乎提高不了预测的准确性。

其实，行为的不可预测性早已植根于人类的潜意识中。

比如，我国前一阵子发射了嫦娥三号探月飞船，在嫦娥三号发射前，科学家们已经计算出了在未来的一个月之后的某个小时、分、秒，嫦娥三号在月球上空高度和经纬度，如果这个计算结果偏离预计几十米，则可能推迟发射，重新计算校准。这是科学对未来的精确预测。

相对的情形是，在晚上10点以后，当我们准备睡觉的时候，能预测明天早餐后下楼碰到的第一个人是谁吗?几乎没有人能知道，但这个巨大的不可预测却没有引起人的关注，几乎没有人会因为不知道下楼碰到的第一个人是谁而影响睡觉。人们对不可预测性熟视无睹。

大数据的有效范围讨论，需要引进一个假设：人们可以自由决定自己的行为(常常称为“自由意志”)。一个人自由决定自己行为，在别人看来，就是他的行为无法预测，如果能够精确预测未来的一举一动，就不具备任何的自我决定的自由。

因此，大数据不能对具体行为作出精确预测，即大数据测不准原理。

大数据的不可预测性说明，企图利用大数据预测用户具体行为的努力或许是徒劳的，我们哪怕掌握一个人从出生开始就有的全部行为信息，也无法预测明天早餐他会吃什么。这也意味着，许多基于用户历史数据进行行为分析的努力会遇到瓶颈，预测缩小到一定范围之后，无法再精确下去。

二、大数据不能用来消除不确定性

大数据不能对具体行为进行预测，还表现大型社区的行为预测上。

最近，很多城市的商业中心开始引入了大数据技术，希望对用户行为作出精确的预测来提高商业中心的有效使用。从单个商家的角度出发，知道进店顾客的精确行为，能提供更针对性的服务，但是，从整个商区的角度来做预测会出现悖论。

之所以大型商圈不仅仅有购物超市，还有甜品店、美食街，人们不是冲着甜品店、美食街来的，但是，因为人们行为的不确定性，不知道购买衬衣、牛奶等生活用品究竟会花多长时间，购物间隙才有了甜品的用武之地，如果购物结束靠近用餐时间，美食街也会有生意。

不仅甜品、美食，商场里的新商品也都是因为人们行为的不确定才被销售出去的，因为新产品并不在人们计划购物的范围内。如果刻意增加购物预测的精确性将会怎样?甜品店、美食街甚至电影院都将是多余的。

生态之美源于不确定性，生态中每一个参与者都表现出足够的自由度，世界才会丰富多彩，大型商业区具有生态特征，对生态型社区进行精确预测，会让整个社区失去生机，所以大数据不能够用来消除生态中的不确定性。

三、大数据不能预测新业务

大数据的宣讲案例中，常常有一个啤酒和尿不湿的故事，建议把啤酒和尿不湿放在一起卖，说是数据统计发现，男人买啤酒的时候会顺便买尿不湿，这显然是一个误导，因为小孩需要尿不湿大概只有3年，一个活70年的男人，只有几年处在需要给孩子买尿不湿的情况，也就是说，大多数情况下，买啤酒的男人没有买尿不湿的必要。

当然，买啤酒和买尿不湿在一定的情况下会成为关联事件，比如一个青年公寓，生孩子的情况比较集中，但是，此时数据出现关联只是结果，青年公寓才是原因。

一些极端情况下，根据数据进行类似啤酒和尿不湿搭配可能会出问题，比如香水和避孕套，男人在逛超市时为取哄情人会买香水，当然，也会偷偷买好避孕套，但是，如果把香水和避孕套放在一起，让男人当着情人面去买避孕套就会产生问题。

不能从大数据的相关性直接得出结论，而是要先确定业务逻辑，再用数据相关性去验证。数据只是行为的结果而不是相反，大数据之所以能够辅助预测，是因为人的行为具有规律性，一个具有朝九晚五、周末大休规律的白领，行为数据才会呈现出以日、周、月、年为周期。

创新业务，也就是跟过去不一样的业务，因此，大数据是没法预测新业务的，也没法根据数据分析确定新出现的业务关联性是临时的，还是可持续的。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据特征数据统计数据预测数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

大数据的反面大数据不能做什么

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据的反面 大数据不能做什么

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据的反面大数据不能做什么