京公网安备 11010802034615号
经营许可证编号:京B2-20210330
使用大数据,就像在沙子里淘金
在过去几年,我们这个世界上的数据的增长速度,相当于之前5年、10年的50倍。
大数据为什么在这个点上爆发?主要原因是,摩尔定律使得存储的数据量空前扩张。与此同时,类似RFID那样的传感器技术也得到了质的提升。于是,就出现了这样的例子——
当某著名服饰品牌把RFID的芯片放在衣服上,如果你觉得一件衣服挺好看,拿到试衣间试,试完了却没买,芯片依然能记录下你试穿了多长时间。由此,他们就会去研究,到底是什么问题,让你没有选择他们的产品。至于你试都不试,他们则认为这很可能是店铺陈列摆放的问题。基于由上述这些数据收集而产生的质量管理和服务改进,这家店的销售额在过去10年里涨了5倍,非常可观。
另外一个例子,如今也非常有名了。美国第二大连锁百货TARGET将大数据运用于营销。某天有一位父亲特别生气,到店里来投诉。他说我的女儿只有14岁,可是你们给她推送母婴广告。结果过了一个星期,经理打电话回访这个父亲,这位父亲表达了歉意:上次是我态度不好,我的女儿是怀孕了。事实就是这样:如果你总是在淘宝上买生活用品,你们家什么时候需要买手纸了,马云可能比你的家人知道得还早。
随着上面的例子越来越多,有人开始认为,我们现在正处在人类历史上的又一个节点:机器的智能有可能在我们这个时代超过人的智能。
这种推理是怎么来的呢?
持上述观点的人认为:由于计算机的速度会不断增加,而人的能力发展基本上是平行的,所以未来某个时间点上,机器智能极有可能超过人的智能。这时,如果我们善于利用大数据的特征,可以达成两件事。其一,可以换一种思维方式来看待世界。其二,可以制造更先进的机器智能。
换言之,大数据就像在一堆沙子里面淘金。当你利用到相较于今日一万倍的数据时,量变到质变的跃升就很可能产生。从这个意义上来讲,未来所有的公司,都可能是要使用大数据的公司。
真正的受益者不会超过2%
未来世界的机器是不会控制人的,但制造智能机器的人,能通过机器控制其他人。比方说,经常去京东、淘宝买东西,实际上就是被他们控制; 天天用微信,某种程度上就被腾讯控制。
在大数据时代,很多商业模式也会变。比如,过去有一个“吉利模式”,买一个刀架送一个刀片。然后吉利靠消费者后期的耗材消费挣钱。可如今,一个冰箱品牌做了这么一件事。它内置于冰箱的芯片可以获知你家有多少牛奶、多少鸡蛋。当这些东西没了,它就会通知给你送来。换言之,这个冰箱除了冷冻功能,还被赋予了“货架”功能。
未来世界里的大数据思维,将细到每一个人、每一个商品、每一笔交易,逐渐影响我们的生活,改变整个生态链。与此同时,技术的发展也不可能人为地停止下来。
但很遗憾的是,在任何一次重大的技术革命中,一开始受益的都是2%的人。正如蒸汽机的发明,第一波受益的,是发明家、工厂主,这是18世纪晚期的事。但连英国维多利亚女王迎来她特别荣耀的时代,都是19世纪中期的事了。美国工业革命,受益的是爱迪生。如今特斯拉也挣了很多钱,受益的是支持他们的GP摩根以及各种关联制造商。老百姓什么时候开始受益呢?是不是过两年,其余98%的人就能受益了呢?不是,可能要经过两代人,半个世纪后,才能有98%的人受益。
美国IT革命,从摩尔定律的发明到今年正好是51年,很多人还没有受益。美国和中国很幸运,踏准了信息革命的节奏。但在我们的周围,南美洲、整个阿拉伯地区、东欧地区,甚至南欧,对IT革命的贡献几乎为零。我希望大家能看到站在你们后面的这98%的人。你们要关注这些,更要坚守住这2%的位置。
学习是一辈子的事
前一阵谷歌的AlphaGo非常火,于是有人问,AlphaGo的学习速度太惊人了,和以前的学习方法相比,未来年轻人的学习,是否只剩下思维模式上的突破?
后来我一个同事,他的孩子在学下棋,他就说那我们去把AlphaGo这个程序打开,看看它到底怎么下的,让孩子学学。结果打开一看,发现根本没法模仿,里面就是一个很简单的数学模型,然后一堆乱七八糟的数字。所以,机器产生智能和人产生智慧完全是两回事。但我想讲两点——
第一,机器最擅长的工作还是重复性。AlphaGo 差不多有50个左右的版本,有时候一天就下好几千盘棋。但人类最重要的一个能力是创造力。在我们祖先活下来的地方,比如走出非洲那会儿,除了生存,还有乐器、创造性和想象力。
第二,比学习方法、思维模式更重要的,其实是终身学习。学习是一辈子的事,这点最重要。我原来周围有一些人比我的学业能力要强一些,但他们一旦拿到博士,就把书本一扔,从此不再学习,慢慢他们的知识就老化了。而我虽然不是一个有很好学习方法的人,却是一个能够不断学习的人。
正如你和你的父辈要掌握的技能早已不同,如今,说任何一个专业如何好、如何坏都失之简单。现在来讲,已经很难有专业比人的寿命要短,因此,你要做好在不远的未来换专业的准备。也许你的专业会过时,但你利用最先进的技术,比如计算机,来学习和提升自己这件事,永远不会过时。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15