京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据都是骗人的_数据分析师
人类不知道的,远远比知道的更有意义大数据能不能预测黑天鹅?还是等失联的飞机找到再说吧
黑天鹅事件与大数据时代,可算是现下流行的两个高冷词汇。
其实黑天鹅并不是什么新词。据说,17世纪的欧洲人认为所有的天鹅都是白色的,因为他们从来没有见过其他颜色的天鹅,当然,我到现在也没见过其他颜色的 天鹅。到了18世纪初,欧洲人远渡重洋来到澳洲,一上岸就惊奇地发现,居然有的天鹅是黑色的!欧洲人吓尿了,因为他们之前那么坚信自己的判断。可残酷的事 实让欧洲人的信念土崩瓦解,他们跑回老家奔走相告:妈妈,原来世界上也有黑天鹅啊史称黑天鹅事件。
黑天鹅的出现预示着,世界 上永远存在不可预测的重大和罕见事件,意料之外,一旦出现却有可能改变一切。人类总是过于相信自己的经验,希望自己的判断、决定和计划能如期而至,但是现 实总是让我们手足无措。无论是泰坦尼克号的沉没、第二次世界大战、911袭击、美国的次贷危机、互联网浪潮等等,都不是人为能够预测出来的,但这些事件 的发生,对人类历史发展的进程产生了重大的影响。
甚至普通人日常生活中的选择,也存在很多黑天鹅现象。我有两个朋友,一个坚韧不拔,对公 司不抛弃不放弃,十几年过去了,一路从程序员成长为技术副总裁,然后公司因为一个突如其来的财务丑闻倒闭了;另一个朋友总是在选择中跳槽,在跳槽中选择, 最后在一家公司工作了两年后,公司上市了,这家伙还去纳斯达克敲了钟!大家可以感受一下,然后静下心来想一想,你所生活过的这十几年,或几十年,哪些日子 是在计划中度过的?
当然,很多人会说我们现在有了大数据相关的技术,我们的信息浩如烟海,如果说过去的数据用筐装就够了,现在得用列车和 舰艇运输,我们用千百万台连接到一起的计算机对这些数据进行计算、加工和统计,难道还预测不出一两只黑天鹅来吗?在自然界的物种领域,当世的科技和讯息的 传播几乎已经不会再犯17世纪欧洲人的错误了。但是,黑天鹅事件,依然难以预测。
讲一个寓言故事吧。有一头不在风口的猪,自打出世以 来就在猪圈这样一个世外桃源生活,每天会来一些站立行走的生物,时不时扔一些好吃的进来,小猪觉得日子惬意极了。它高兴了就去泥里打滚,忧伤了就趴在猪圈 的护栏上看夕阳西下,春去秋来,岁月不争。经过数百天的大数据分析,小猪觉得日子会一直这样过下去,直到他从小猪长成了肥猪在春节前的一个下午,一次 血腥的杀戮改变了猪的信念:尼玛大数据都是骗人的啊惨叫戛然而止。
无论是你的个人收入、知名度,还是你的Google 搜索量、血压、牙患、股票价格都有可能是黑天鹅事件,它们在过去的几百天之内只发生了微小的变化,并且具备一定的趋势,你以为事情会一直这样发展下去 了,就像太阳每天从东边升起、西边坠落一样自然,但是到了1001天的时候,砰的一声,一个过去从未有过的巨大变化发生了!比如,前些天康师傅就被立 案调查了。
人类不知道的远远比知道的更有意义。历史永远不是线性发展,每一次跳跃前行中都有黑天鹅的身影。这或许才是黑天鹅要告诉我们的真相。
那么普通人如何面对黑天鹅现象呢?如果我说他强任他强,清风抚山冈;他横由他横,明月照大江,大家会不会点赞呢?料想是不会的,所以我的看法是:
1. 保持独立的人格和思考,持续提升个人能力。在改变历史进程的黑天鹅事件中,个人的作用可能微乎其微,但是在生活中就有用了。比如你早晨起了床,刷了 牙,吃了早饭,为自己的梨形身材套上合身的西装并扎好领带,高高兴兴去上班,然后发现自己失业了。没关系,哥一身是胆满腹经纶左右手都能编程,分分钟找到 下家并薪资翻倍。
2.努力让自己的生活发生正面的黑天鹅事件,寻找报酬具有突破性的职业和工作,工作成果不受时间限制,也不是按件记酬。比如我,现在就寄希望成为图书销售百万的技术作家神马的
3.通过反证接近真相。当所有人都认为某件事的发生是理所当然的,不要急着附和,往其他方向看一看想一想,不是有句老话吗,我不能证明这件事是正确的,但我可以证明它是错误的。不是说不能过马路,而是说不要闭着眼睛过马路。
等等,说了半天,大数据是干吗的?就目前数据计算能力,大数据主要应用于经营决策、智能推荐、定向营销、机器学习和人工智能等方面,至于预测黑天鹅事件,还是等失联的飞机找到再说吧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11