
使用大数据,就像在沙子里淘金
在过去几年,我们这个世界上的数据的增长速度,相当于之前5年、10年的50倍。
大数据为什么在这个点上爆发?主要原因是,摩尔定律使得存储的数据量空前扩张。与此同时,类似RFID那样的传感器技术也得到了质的提升。于是,就出现了这样的例子——
当某著名服饰品牌把RFID的芯片放在衣服上,如果你觉得一件衣服挺好看,拿到试衣间试,试完了却没买,芯片依然能记录下你试穿了多长时间。由此,他们就会去研究,到底是什么问题,让你没有选择他们的产品。至于你试都不试,他们则认为这很可能是店铺陈列摆放的问题。基于由上述这些数据收集而产生的质量管理和服务改进,这家店的销售额在过去10年里涨了5倍,非常可观。
另外一个例子,如今也非常有名了。美国第二大连锁百货TARGET将大数据运用于营销。某天有一位父亲特别生气,到店里来投诉。他说我的女儿只有14岁,可是你们给她推送母婴广告。结果过了一个星期,经理打电话回访这个父亲,这位父亲表达了歉意:上次是我态度不好,我的女儿是怀孕了。事实就是这样:如果你总是在淘宝上买生活用品,你们家什么时候需要买手纸了,马云可能比你的家人知道得还早。
随着上面的例子越来越多,有人开始认为,我们现在正处在人类历史上的又一个节点:机器的智能有可能在我们这个时代超过人的智能。
这种推理是怎么来的呢?
持上述观点的人认为:由于计算机的速度会不断增加,而人的能力发展基本上是平行的,所以未来某个时间点上,机器智能极有可能超过人的智能。这时,如果我们善于利用大数据的特征,可以达成两件事。其一,可以换一种思维方式来看待世界。其二,可以制造更先进的机器智能。
换言之,大数据就像在一堆沙子里面淘金。当你利用到相较于今日一万倍的数据时,量变到质变的跃升就很可能产生。从这个意义上来讲,未来所有的公司,都可能是要使用大数据的公司。
真正的受益者不会超过2%
未来世界的机器是不会控制人的,但制造智能机器的人,能通过机器控制其他人。比方说,经常去京东、淘宝买东西,实际上就是被他们控制; 天天用微信,某种程度上就被腾讯控制。
在大数据时代,很多商业模式也会变。比如,过去有一个“吉利模式”,买一个刀架送一个刀片。然后吉利靠消费者后期的耗材消费挣钱。可如今,一个冰箱品牌做了这么一件事。它内置于冰箱的芯片可以获知你家有多少牛奶、多少鸡蛋。当这些东西没了,它就会通知给你送来。换言之,这个冰箱除了冷冻功能,还被赋予了“货架”功能。
未来世界里的大数据思维,将细到每一个人、每一个商品、每一笔交易,逐渐影响我们的生活,改变整个生态链。与此同时,技术的发展也不可能人为地停止下来。
但很遗憾的是,在任何一次重大的技术革命中,一开始受益的都是2%的人。正如蒸汽机的发明,第一波受益的,是发明家、工厂主,这是18世纪晚期的事。但连英国维多利亚女王迎来她特别荣耀的时代,都是19世纪中期的事了。美国工业革命,受益的是爱迪生。如今特斯拉也挣了很多钱,受益的是支持他们的GP摩根以及各种关联制造商。老百姓什么时候开始受益呢?是不是过两年,其余98%的人就能受益了呢?不是,可能要经过两代人,半个世纪后,才能有98%的人受益。
美国IT革命,从摩尔定律的发明到今年正好是51年,很多人还没有受益。美国和中国很幸运,踏准了信息革命的节奏。但在我们的周围,南美洲、整个阿拉伯地区、东欧地区,甚至南欧,对IT革命的贡献几乎为零。我希望大家能看到站在你们后面的这98%的人。你们要关注这些,更要坚守住这2%的位置。
学习是一辈子的事
前一阵谷歌的AlphaGo非常火,于是有人问,AlphaGo的学习速度太惊人了,和以前的学习方法相比,未来年轻人的学习,是否只剩下思维模式上的突破?
后来我一个同事,他的孩子在学下棋,他就说那我们去把AlphaGo这个程序打开,看看它到底怎么下的,让孩子学学。结果打开一看,发现根本没法模仿,里面就是一个很简单的数学模型,然后一堆乱七八糟的数字。所以,机器产生智能和人产生智慧完全是两回事。但我想讲两点——
第一,机器最擅长的工作还是重复性。AlphaGo 差不多有50个左右的版本,有时候一天就下好几千盘棋。但人类最重要的一个能力是创造力。在我们祖先活下来的地方,比如走出非洲那会儿,除了生存,还有乐器、创造性和想象力。
第二,比学习方法、思维模式更重要的,其实是终身学习。学习是一辈子的事,这点最重要。我原来周围有一些人比我的学业能力要强一些,但他们一旦拿到博士,就把书本一扔,从此不再学习,慢慢他们的知识就老化了。而我虽然不是一个有很好学习方法的人,却是一个能够不断学习的人。
正如你和你的父辈要掌握的技能早已不同,如今,说任何一个专业如何好、如何坏都失之简单。现在来讲,已经很难有专业比人的寿命要短,因此,你要做好在不远的未来换专业的准备。也许你的专业会过时,但你利用最先进的技术,比如计算机,来学习和提升自己这件事,永远不会过时。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01