京公网安备 11010802034615号
经营许可证编号:京B2-20210330
告知5件大数据能不能做的事
引言
“大数据让我们变得更智能,而不是更聪明。”– Tim Leberecht
“大数据”一词早在20世纪40年代就出现了。全世界的公司都在竭尽全力地探索它的潜力。全球的科技巨头们都在大幅增加大数据技术的支出。这种趋势在主要行业的竞争者间还在加剧。
结果,根据调查公司IDC的预测, 大数据技术及服务直到2019年将以每年23%的速度增长.2019年在大数据上的支出将达到486亿美元。
这就是为啥大数据正在被全世界人们接受的原因。
公司从大数据身上看到了一线生机,让他们可以利用任何大小的数据。智能手机、GPS、传感器等在收集数据方面都发挥着作用。每一比特的数据都被收集起来然后处理成对我们(客户)有价值的信息。
在大数据不断给人们带来效益的时候,人们没有看到它 “不能” 做的事情, 也让我感到惊讶。但是我很快意识到,大数据不断的补充我们的商业直觉却绝不会成为替代品。
在本文中,我将过去7天的调查呈现给各位。我强烈的好奇心驱使我这样做。大数据对一个公司成功是至关重要的事实让我无法理解。大数据分析能胜任很多事情,但也有很多事情无能为力。
注意:我的想法并无完全,只是给各位提供一个思路。随便将你的想法留言在评论区中吧。
“大”数据的”小”练习
这个练习将为我们的将来做好准备。我们必须清楚要发生的事情还在后头。如果你在阅读这里,我请你考虑这样一个问题,你只需要写出(我已经共享了答案):
比如,如果我使用与大数据相关的平台得出这样一个逻辑结论,X是不可能的。我将排除与X有关的所有业务问题,能明白吗?
以下就是我的一个清单。如果你不同意下列中的观点,那么请证明一下吧!我会很乐意即使修改我的清单。让我们用一些商业直觉和分析的注解来开始解释我的一些思想。
80:20法则
这个法则说的是
“花80%的时间从过去的数据创建故事,20%的时间花在用现在的商业把这些故事串联起来”
说明:我相信没有跟商业直觉联系起来的分析见解都是没有用的。同意么?而且, 随着时间的流逝,以数据为驱动的部分在成指数级增长。 公司正在被数据的洪流所淹没。但这真的有用吗?不!
公司必须意识到,正确的将成功的商业分析与需要的商业视觉的比例是80:20。
如果我们建立一个故事用80%的时间分析过去的信息以求得对未来的预期,我们需要投入20%的时间思考这些信息对我们的业务有没有帮助。我们必须想到一些可以改变我们的将来和满足更广泛的业务目标的方法。这需要很强的商业理解力和良好的业务规则的知识。
这条法则中20%的成分是无可替代的。因此,人类的介入是为了解决这20%的问题,机器是不能满足的。即使是人工智能也不行。因为,人类的创造力是在无拘束的思考中诞生的。我相信创造力是机器无法带给我们的。我的清单正是受到了这个法则的启发。
5件大数据可以做到的事情
1.诊断分析 :我们每天都在做这个事情。机器更擅长做这个。当一个事件发生的时候,我们发现对寻找起因感兴趣。比如,设想在沙漠A挂起了沙暴,我们有沙漠A地区的各种参数:温度,气压,骆驼,道路,汽车等等。如果我们能将这些参数跟该地区的沙暴联系起来,如果我们知道一些因果关系,我们可能就会避免沙暴。想象下大数据的威力。
2.预测分析 :我们经常做这个事情。预测分析是根植在我们的DNA里的。比如,我们在全球有一个酒店连锁。现在我们需要找出那些酒店是没有达到销售目标的。如果我们知道的话我们就可以将努力集中在他们身上。这成为了预测分析的经典问题。
3.在未知元素间寻找关联 :我喜欢这部分分析。比方说销售雇员的数量跟销售额真的没有关系吗。你可能会减少一些雇员来看看是否真的对销售额没有损失。
4.规范的分析 :这是分析学的未来。比如说我们尝试着预测一个在大众目标的恐怖袭击然后安全的将人们转移的策略。做出这个预测,你需要做出在那个时候那个地点的游客人数,可能会被爆炸所影响到的地区等各种预测。
5.监控发生的事件 :行业中的大部分人都在做监控事件的工作。比如,你需要检测一个活动的反馈找到强烈和不强烈的部分。这些分析成为运营一个企业的关键
5件大数据不可以做到的事情
1.预测一个确定的未来 :使用机器学习的工具我们可以达到90%的精度。但是我们无法达到100%的准确。如果我们可以做到的话,我可以确切的告诉你谁才是目标以及每一次100%的响应率。但可惜的是这绝不会发生。
2.归咎于新的数据源 :在任何分析上,归责耗费了大部分时间。我相信这就是你的创造力和商业理解的来源。可能的是,你无法摆脱在你的分析中最无聊的部分。
3.找到一个商业问题的创新的解决方案 :创造力是人类永远的专利。没有机器可以找到问题的创新的解决方法。这是因为即使是人工智能也是由人们去编码的产物,创造力是不会从算法自己学习而来的。
4.找到定义不是很明确的问题的解决方法 :分析学最大的挑战就是从业务问题中形成一个分析问题模型。如果你能做得很好,你正在成为一个分析明星。这种角色是机器无法取代你的。比如,你的业务问题是管理损耗。除非你定义了响应者,时间窗口等,没有预测算法可以帮你。
5.数据管理/简化新数据源的数据 :随着数据量的增长,数据的管理正在成为一个难题。我们正在处理各种不同结构化的数据。比如,图表数据可能更适合网络分析但是对活动数据是没用的。这部分信息也是机器无法分析的。
最后
我相信这篇文章将发挥它的潜力如果你尝试了文章中的练习的话。试着从一个更全面的视角中思考,你会发现机器无法做到的事情。比如,我的初始点80:20法则指出机器将无法带来创造力。这个启发点帮我思考在分析的过程中那些部分是需要创造力的。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22