京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据都是骗人的_数据分析师
人类不知道的,远远比知道的更有意义大数据能不能预测黑天鹅?还是等失联的飞机找到再说吧
黑天鹅事件与大数据时代,可算是现下流行的两个高冷词汇。
其实黑天鹅并不是什么新词。据说,17世纪的欧洲人认为所有的天鹅都是白色的,因为他们从来没有见过其他颜色的天鹅,当然,我到现在也没见过其他颜色的 天鹅。到了18世纪初,欧洲人远渡重洋来到澳洲,一上岸就惊奇地发现,居然有的天鹅是黑色的!欧洲人吓尿了,因为他们之前那么坚信自己的判断。可残酷的事 实让欧洲人的信念土崩瓦解,他们跑回老家奔走相告:妈妈,原来世界上也有黑天鹅啊史称黑天鹅事件。
黑天鹅的出现预示着,世界 上永远存在不可预测的重大和罕见事件,意料之外,一旦出现却有可能改变一切。人类总是过于相信自己的经验,希望自己的判断、决定和计划能如期而至,但是现 实总是让我们手足无措。无论是泰坦尼克号的沉没、第二次世界大战、911袭击、美国的次贷危机、互联网浪潮等等,都不是人为能够预测出来的,但这些事件 的发生,对人类历史发展的进程产生了重大的影响。
甚至普通人日常生活中的选择,也存在很多黑天鹅现象。我有两个朋友,一个坚韧不拔,对公 司不抛弃不放弃,十几年过去了,一路从程序员成长为技术副总裁,然后公司因为一个突如其来的财务丑闻倒闭了;另一个朋友总是在选择中跳槽,在跳槽中选择, 最后在一家公司工作了两年后,公司上市了,这家伙还去纳斯达克敲了钟!大家可以感受一下,然后静下心来想一想,你所生活过的这十几年,或几十年,哪些日子 是在计划中度过的?
当然,很多人会说我们现在有了大数据相关的技术,我们的信息浩如烟海,如果说过去的数据用筐装就够了,现在得用列车和 舰艇运输,我们用千百万台连接到一起的计算机对这些数据进行计算、加工和统计,难道还预测不出一两只黑天鹅来吗?在自然界的物种领域,当世的科技和讯息的 传播几乎已经不会再犯17世纪欧洲人的错误了。但是,黑天鹅事件,依然难以预测。
讲一个寓言故事吧。有一头不在风口的猪,自打出世以 来就在猪圈这样一个世外桃源生活,每天会来一些站立行走的生物,时不时扔一些好吃的进来,小猪觉得日子惬意极了。它高兴了就去泥里打滚,忧伤了就趴在猪圈 的护栏上看夕阳西下,春去秋来,岁月不争。经过数百天的大数据分析,小猪觉得日子会一直这样过下去,直到他从小猪长成了肥猪在春节前的一个下午,一次 血腥的杀戮改变了猪的信念:尼玛大数据都是骗人的啊惨叫戛然而止。
无论是你的个人收入、知名度,还是你的Google 搜索量、血压、牙患、股票价格都有可能是黑天鹅事件,它们在过去的几百天之内只发生了微小的变化,并且具备一定的趋势,你以为事情会一直这样发展下去 了,就像太阳每天从东边升起、西边坠落一样自然,但是到了1001天的时候,砰的一声,一个过去从未有过的巨大变化发生了!比如,前些天康师傅就被立 案调查了。
人类不知道的远远比知道的更有意义。历史永远不是线性发展,每一次跳跃前行中都有黑天鹅的身影。这或许才是黑天鹅要告诉我们的真相。
那么普通人如何面对黑天鹅现象呢?如果我说他强任他强,清风抚山冈;他横由他横,明月照大江,大家会不会点赞呢?料想是不会的,所以我的看法是:
1. 保持独立的人格和思考,持续提升个人能力。在改变历史进程的黑天鹅事件中,个人的作用可能微乎其微,但是在生活中就有用了。比如你早晨起了床,刷了 牙,吃了早饭,为自己的梨形身材套上合身的西装并扎好领带,高高兴兴去上班,然后发现自己失业了。没关系,哥一身是胆满腹经纶左右手都能编程,分分钟找到 下家并薪资翻倍。
2.努力让自己的生活发生正面的黑天鹅事件,寻找报酬具有突破性的职业和工作,工作成果不受时间限制,也不是按件记酬。比如我,现在就寄希望成为图书销售百万的技术作家神马的
3.通过反证接近真相。当所有人都认为某件事的发生是理所当然的,不要急着附和,往其他方向看一看想一想,不是有句老话吗,我不能证明这件事是正确的,但我可以证明它是错误的。不是说不能过马路,而是说不要闭着眼睛过马路。
等等,说了半天,大数据是干吗的?就目前数据计算能力,大数据主要应用于经营决策、智能推荐、定向营销、机器学习和人工智能等方面,至于预测黑天鹅事件,还是等失联的飞机找到再说吧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22