
人类不知道的,远远比知道的更有意义大数据能不能预测“黑天鹅”?还是等失联的飞机找到再说吧
“黑天鹅事件”与“大数据时代”,可算是现下流行的两个高冷词汇。
其实“黑天鹅”并不是什么新词。据说,17世纪的欧洲人认为所有的天鹅都是白色的,因为他们从来没有见过其他颜色的天鹅,当然,我到现在也没见过其他颜色的天鹅。到了18世纪初,欧洲人远渡重洋来到澳洲,一上岸就惊奇地发现,居然有的天鹅是黑色的!欧洲人吓尿了,因为他们之前那么坚信自己的判断。可残酷的事实让欧洲人的信念土崩瓦解,他们跑回老家奔走相告:妈妈,原来世界上也有黑天鹅啊……史称“黑天鹅事件”。
“黑天鹅”的出现预示着,世界上永远存在不可预测的重大和罕见事件,意料之外,一旦出现却有可能改变一切。人类总是过于相信自己的经验,希望自己的判断、决定和计划能如期而至,但是现实总是让我们手足无措。无论是泰坦尼克号的沉没、第二次世界大战、9·11袭击、美国的次贷危机、互联网浪潮等等,都不是人为能够预测出来的,但这些事件的发生,对人类历史发展的进程产生了重大的影响。
甚至普通人日常生活中的选择,也存在很多黑天鹅现象。我有两个朋友,一个坚韧不拔,对公司不抛弃不放弃,十几年过去了,一路从程序员成长为技术副总裁,然后公司因为一个突如其来的财务丑闻倒闭了;另一个朋友总是在选择中跳槽,在跳槽中选择,最后在一家公司工作了两年后,公司上市了,这家伙还去纳斯达克敲了钟!大家可以感受一下,然后静下心来想一想,你所生活过的这十几年,或几十年,哪些日子是在计划中度过的?
当然,很多人会说我们现在有了大数据相关的技术,我们的信息浩如烟海,如果说过去的数据用筐装就够了,现在得用列车和舰艇运输,我们用千百万台连接到一起的计算机对这些数据进行计算、加工和统计,难道还预测不出一两只黑天鹅来吗?在自然界的物种领域,当世的科技和讯息的传播几乎已经不会再犯17世纪欧洲人的错误了。但是,“黑天鹅事件”,依然难以预测。
讲一个寓言故事吧。有一头不在风口的猪,自打出世以来就在猪圈这样一个世外桃源生活,每天会来一些站立行走的生物,时不时扔一些好吃的进来,小猪觉得日子惬意极了。它高兴了就去泥里打滚,忧伤了就趴在猪圈的护栏上看夕阳西下,春去秋来,岁月不争。经过数百天的大数据分析,小猪觉得日子会一直这样过下去,直到他从小猪长成了肥猪……在春节前的一个下午,一次血腥的杀戮改变了猪的信念:尼玛大数据都是骗人的啊……惨叫戛然而止。
无论是你的个人收入、知名度,还是你的Google 搜索量、血压、牙患、股票价格都有可能是“黑天鹅事件”,它们在过去的几百天之内只发生了微小的变化,并且具备一定的趋势,你以为事情会一直这样发展下去了,就像太阳每天从东边升起、西边坠落一样自然,但是到了1001天的时候,砰的一声,一个过去从未有过的巨大变化发生了!比如,前些天“康师傅”就被立案调查了。
人类不知道的远远比知道的更有意义。历史永远不是线性发展,每一次跳跃前行中都有“黑天鹅”的身影。这或许才是“黑天鹅”要告诉我们的真相。
那么普通人如何面对“黑天鹅现象”呢?如果我说“他强任他强,清风抚山冈;他横由他横,明月照大江”,大家会不会点赞呢?料想是不会的,所以我的看法是:
1.保持独立的人格和思考,持续提升个人能力。在改变历史进程的“黑天鹅事件”中,个人的作用可能微乎其微,但是在生活中就有用了。比如你早晨起了床,刷了牙,吃了早饭,为自己的梨形身材套上合身的西装并扎好领带,高高兴兴去上班,然后发现自己失业了。没关系,哥一身是胆满腹经纶左右手都能编程,分分钟找到下家并薪资翻倍。
2.努力让自己的生活发生正面的“黑天鹅事件”,寻找报酬具有突破性的职业和工作,工作成果不受时间限制,也不是按件记酬。比如我,现在就寄希望成为图书销售百万的技术作家神马的……
3.通过反证接近真相。当所有人都认为某件事的发生是理所当然的,不要急着附和,往其他方向看一看想一想,不是有句老话吗,我不能证明这件事是正确的,但我可以证明它是错误的。不是说不能过马路,而是说不要闭着眼睛过马路。
等等,说了半天,大数据是干吗的?就目前数据计算能力,大数据主要应用于经营决策、智能推荐、定向营销、机器学习和人工智能等方面,至于预测“黑天鹅事件”,还是等失联的飞机找到再说吧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10