京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据都是骗人的_数据分析师
人类不知道的,远远比知道的更有意义大数据能不能预测黑天鹅?还是等失联的飞机找到再说吧
黑天鹅事件与大数据时代,可算是现下流行的两个高冷词汇。
其实黑天鹅并不是什么新词。据说,17世纪的欧洲人认为所有的天鹅都是白色的,因为他们从来没有见过其他颜色的天鹅,当然,我到现在也没见过其他颜色的 天鹅。到了18世纪初,欧洲人远渡重洋来到澳洲,一上岸就惊奇地发现,居然有的天鹅是黑色的!欧洲人吓尿了,因为他们之前那么坚信自己的判断。可残酷的事 实让欧洲人的信念土崩瓦解,他们跑回老家奔走相告:妈妈,原来世界上也有黑天鹅啊史称黑天鹅事件。
黑天鹅的出现预示着,世界 上永远存在不可预测的重大和罕见事件,意料之外,一旦出现却有可能改变一切。人类总是过于相信自己的经验,希望自己的判断、决定和计划能如期而至,但是现 实总是让我们手足无措。无论是泰坦尼克号的沉没、第二次世界大战、911袭击、美国的次贷危机、互联网浪潮等等,都不是人为能够预测出来的,但这些事件 的发生,对人类历史发展的进程产生了重大的影响。
甚至普通人日常生活中的选择,也存在很多黑天鹅现象。我有两个朋友,一个坚韧不拔,对公 司不抛弃不放弃,十几年过去了,一路从程序员成长为技术副总裁,然后公司因为一个突如其来的财务丑闻倒闭了;另一个朋友总是在选择中跳槽,在跳槽中选择, 最后在一家公司工作了两年后,公司上市了,这家伙还去纳斯达克敲了钟!大家可以感受一下,然后静下心来想一想,你所生活过的这十几年,或几十年,哪些日子 是在计划中度过的?
当然,很多人会说我们现在有了大数据相关的技术,我们的信息浩如烟海,如果说过去的数据用筐装就够了,现在得用列车和 舰艇运输,我们用千百万台连接到一起的计算机对这些数据进行计算、加工和统计,难道还预测不出一两只黑天鹅来吗?在自然界的物种领域,当世的科技和讯息的 传播几乎已经不会再犯17世纪欧洲人的错误了。但是,黑天鹅事件,依然难以预测。
讲一个寓言故事吧。有一头不在风口的猪,自打出世以 来就在猪圈这样一个世外桃源生活,每天会来一些站立行走的生物,时不时扔一些好吃的进来,小猪觉得日子惬意极了。它高兴了就去泥里打滚,忧伤了就趴在猪圈 的护栏上看夕阳西下,春去秋来,岁月不争。经过数百天的大数据分析,小猪觉得日子会一直这样过下去,直到他从小猪长成了肥猪在春节前的一个下午,一次 血腥的杀戮改变了猪的信念:尼玛大数据都是骗人的啊惨叫戛然而止。
无论是你的个人收入、知名度,还是你的Google 搜索量、血压、牙患、股票价格都有可能是黑天鹅事件,它们在过去的几百天之内只发生了微小的变化,并且具备一定的趋势,你以为事情会一直这样发展下去 了,就像太阳每天从东边升起、西边坠落一样自然,但是到了1001天的时候,砰的一声,一个过去从未有过的巨大变化发生了!比如,前些天康师傅就被立 案调查了。
人类不知道的远远比知道的更有意义。历史永远不是线性发展,每一次跳跃前行中都有黑天鹅的身影。这或许才是黑天鹅要告诉我们的真相。
那么普通人如何面对黑天鹅现象呢?如果我说他强任他强,清风抚山冈;他横由他横,明月照大江,大家会不会点赞呢?料想是不会的,所以我的看法是:
1. 保持独立的人格和思考,持续提升个人能力。在改变历史进程的黑天鹅事件中,个人的作用可能微乎其微,但是在生活中就有用了。比如你早晨起了床,刷了 牙,吃了早饭,为自己的梨形身材套上合身的西装并扎好领带,高高兴兴去上班,然后发现自己失业了。没关系,哥一身是胆满腹经纶左右手都能编程,分分钟找到 下家并薪资翻倍。
2.努力让自己的生活发生正面的黑天鹅事件,寻找报酬具有突破性的职业和工作,工作成果不受时间限制,也不是按件记酬。比如我,现在就寄希望成为图书销售百万的技术作家神马的
3.通过反证接近真相。当所有人都认为某件事的发生是理所当然的,不要急着附和,往其他方向看一看想一想,不是有句老话吗,我不能证明这件事是正确的,但我可以证明它是错误的。不是说不能过马路,而是说不要闭着眼睛过马路。
等等,说了半天,大数据是干吗的?就目前数据计算能力,大数据主要应用于经营决策、智能推荐、定向营销、机器学习和人工智能等方面,至于预测黑天鹅事件,还是等失联的飞机找到再说吧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23