京公网安备 11010802034615号
经营许可证编号:京B2-20210330
告知5件大数据能不能做的事
引言
“大数据让我们变得更智能,而不是更聪明。”– Tim Leberecht
“大数据”一词早在20世纪40年代就出现了。全世界的公司都在竭尽全力地探索它的潜力。全球的科技巨头们都在大幅增加大数据技术的支出。这种趋势在主要行业的竞争者间还在加剧。
结果,根据调查公司IDC的预测, 大数据技术及服务直到2019年将以每年23%的速度增长.2019年在大数据上的支出将达到486亿美元。
这就是为啥大数据正在被全世界人们接受的原因。
公司从大数据身上看到了一线生机,让他们可以利用任何大小的数据。智能手机、GPS、传感器等在收集数据方面都发挥着作用。每一比特的数据都被收集起来然后处理成对我们(客户)有价值的信息。
在大数据不断给人们带来效益的时候,人们没有看到它 “不能” 做的事情, 也让我感到惊讶。但是我很快意识到,大数据不断的补充我们的商业直觉却绝不会成为替代品。
在本文中,我将过去7天的调查呈现给各位。我强烈的好奇心驱使我这样做。大数据对一个公司成功是至关重要的事实让我无法理解。大数据分析能胜任很多事情,但也有很多事情无能为力。
注意:我的想法并无完全,只是给各位提供一个思路。随便将你的想法留言在评论区中吧。
“大”数据的”小”练习
这个练习将为我们的将来做好准备。我们必须清楚要发生的事情还在后头。如果你在阅读这里,我请你考虑这样一个问题,你只需要写出(我已经共享了答案):
比如,如果我使用与大数据相关的平台得出这样一个逻辑结论,X是不可能的。我将排除与X有关的所有业务问题,能明白吗?
以下就是我的一个清单。如果你不同意下列中的观点,那么请证明一下吧!我会很乐意即使修改我的清单。让我们用一些商业直觉和分析的注解来开始解释我的一些思想。
80:20法则
这个法则说的是
“花80%的时间从过去的数据创建故事,20%的时间花在用现在的商业把这些故事串联起来”
说明:我相信没有跟商业直觉联系起来的分析见解都是没有用的。同意么?而且, 随着时间的流逝,以数据为驱动的部分在成指数级增长。 公司正在被数据的洪流所淹没。但这真的有用吗?不!
公司必须意识到,正确的将成功的商业分析与需要的商业视觉的比例是80:20。
如果我们建立一个故事用80%的时间分析过去的信息以求得对未来的预期,我们需要投入20%的时间思考这些信息对我们的业务有没有帮助。我们必须想到一些可以改变我们的将来和满足更广泛的业务目标的方法。这需要很强的商业理解力和良好的业务规则的知识。
这条法则中20%的成分是无可替代的。因此,人类的介入是为了解决这20%的问题,机器是不能满足的。即使是人工智能也不行。因为,人类的创造力是在无拘束的思考中诞生的。我相信创造力是机器无法带给我们的。我的清单正是受到了这个法则的启发。
5件大数据可以做到的事情
1.诊断分析 :我们每天都在做这个事情。机器更擅长做这个。当一个事件发生的时候,我们发现对寻找起因感兴趣。比如,设想在沙漠A挂起了沙暴,我们有沙漠A地区的各种参数:温度,气压,骆驼,道路,汽车等等。如果我们能将这些参数跟该地区的沙暴联系起来,如果我们知道一些因果关系,我们可能就会避免沙暴。想象下大数据的威力。
2.预测分析 :我们经常做这个事情。预测分析是根植在我们的DNA里的。比如,我们在全球有一个酒店连锁。现在我们需要找出那些酒店是没有达到销售目标的。如果我们知道的话我们就可以将努力集中在他们身上。这成为了预测分析的经典问题。
3.在未知元素间寻找关联 :我喜欢这部分分析。比方说销售雇员的数量跟销售额真的没有关系吗。你可能会减少一些雇员来看看是否真的对销售额没有损失。
4.规范的分析 :这是分析学的未来。比如说我们尝试着预测一个在大众目标的恐怖袭击然后安全的将人们转移的策略。做出这个预测,你需要做出在那个时候那个地点的游客人数,可能会被爆炸所影响到的地区等各种预测。
5.监控发生的事件 :行业中的大部分人都在做监控事件的工作。比如,你需要检测一个活动的反馈找到强烈和不强烈的部分。这些分析成为运营一个企业的关键
5件大数据不可以做到的事情
1.预测一个确定的未来 :使用机器学习的工具我们可以达到90%的精度。但是我们无法达到100%的准确。如果我们可以做到的话,我可以确切的告诉你谁才是目标以及每一次100%的响应率。但可惜的是这绝不会发生。
2.归咎于新的数据源 :在任何分析上,归责耗费了大部分时间。我相信这就是你的创造力和商业理解的来源。可能的是,你无法摆脱在你的分析中最无聊的部分。
3.找到一个商业问题的创新的解决方案 :创造力是人类永远的专利。没有机器可以找到问题的创新的解决方法。这是因为即使是人工智能也是由人们去编码的产物,创造力是不会从算法自己学习而来的。
4.找到定义不是很明确的问题的解决方法 :分析学最大的挑战就是从业务问题中形成一个分析问题模型。如果你能做得很好,你正在成为一个分析明星。这种角色是机器无法取代你的。比如,你的业务问题是管理损耗。除非你定义了响应者,时间窗口等,没有预测算法可以帮你。
5.数据管理/简化新数据源的数据 :随着数据量的增长,数据的管理正在成为一个难题。我们正在处理各种不同结构化的数据。比如,图表数据可能更适合网络分析但是对活动数据是没用的。这部分信息也是机器无法分析的。
最后
我相信这篇文章将发挥它的潜力如果你尝试了文章中的练习的话。试着从一个更全面的视角中思考,你会发现机器无法做到的事情。比如,我的初始点80:20法则指出机器将无法带来创造力。这个启发点帮我思考在分析的过程中那些部分是需要创造力的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09