京公网安备 11010802034615号
经营许可证编号:京B2-20210330
企业数据的秘密:大数据时代商业规则
如今的商业世界,已经变成了飘浮在数据海洋上的巨轮。在这样一个时代,任何人都必须用数据来说话。而那些通过数据能力驶入蓝海的企业,将会赢得丰厚的回报——
我们的未来能否被预测?
在澳大利亚被发现之前,生活在十七世纪欧洲的人们都相信一件事:所有的天鹅都是白色的。因为当时所能见到的天鹅的确都是白色的,所以根据经验,那简直就是一个真理,至少可以算是一个公理吧。那么,见到黑色天鹅的概率是多少呢?根本无法计算,也没有人想过要计算。直到1697年,探险家在澳大利亚发现了黑天鹅,人们才知道以前的结论是片面的。
这证明了我们的认知是多么局限:虽然你是在观察了几百万只天鹅之后才得出了“所有的天鹅都是白色的”结论,但只需要另一个发现就能将它彻底推翻——2007年,全球最具影响力的商业思想家塔勒布用一本《黑天鹅》几乎让世人绝望:我们总是以为自己知道得很多,能够预测未来,但一次极端事件,就足以影响整个历史的走势。
我们的未来真的不可能被预测吗?
每一天,我们的电子邮件都保存在电邮供应商的日志文件中;我们的通话记录都被加上时间标记备份在电话公司的大容量硬盘上;我们何时何地买了什么东西,我们的喜好、品味以及支付能力都被信用卡提供商编目归档;我们的所有个人网页、空间、微博、即时通讯文件,还有博客信息,都被保存在多个服务器上;我们的即时行踪完全被手机供应商掌握;我们的容貌和穿着打扮都被安装在各大商场和街角的摄像头捕捉并记录……
我们通常不太在意,但我们的生活完全能被这些如雨后春笋般出现的数据库所记录的信息串联起来。马克·吐温曾说,历史不会重演,却自有其韵律。虽然万事皆显出自发偶然之态,但实际上,它远比你想象中的容易预测。
进而,全球复杂网络权威巴拉巴西通过研究大胆地认为,93%的人类行为是可以预测的。
这是另一种颠覆性的结论。用巴拉巴西的话来说,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。生活如此抵触随机运动,渴望朝更安全、更规则的方向发展。人类行为看上去很随意、很偶然,却极其容易被预测。
如果真有93%的人类行为可以被预测,这还意味着,我们的商业行为同样可以进入可掌控的范围——而这,就是企业数据里的秘密。
综述:大数据时代的商业规则
胡适说中国人习惯于“差不多先生”,凡事马马虎虎、不求精确。历史学家黄仁宇先生则认为,中国不懂得用数字来管理国家。而现代化社会最明显的标志就是,它能够将整个社会用数字管理。
事实上,如今的商业世界,已经变成了飘浮在数据海洋上的巨轮。在这样一个时代,任何人都必须用数据来说话。而那些通过数据能力驶入蓝海的企业,将会赢得丰厚的回报。
数据井喷
5月18日,脸谱网(Facebook)在美IPO上市。在所有交易完成之前,几乎没有人敢说自己有把握去预测它上市当天股价的走势,但一家社交媒体监测平台却奇迹般地做到了。
这家监测平台监测了脸谱IPO当天推特(Twitter)上的情感倾向与脸谱股价波动的关联。例如,在开盘前推特上的情感逐渐转向负面,25分钟之后,脸谱的股价便开始下跌;而当推特上的情感转向正面时,其股价在8分钟之后也开始了回弹;当股市接近收盘时,推特上的情感转向负面,10分钟后股价又开始下跌。
最终的结论是,推特上每一次情感倾向的转向都会影响脸谱网股价的波动,延迟情况只有几分钟到20多分钟。
这仅仅只是基于社交网络产生的大数据进行“预见未来”的众多案例之一,事实上“大数据”所能带来的巨大商业价值,已经被人认为将引领一场足以匹敌20世纪计算机革命的巨大变革。
由古至今,从未有一个时代出现过如此大规模的数据爆炸。2010年,全球企业一年新存储的数据就超过了7000拍字节,全球消费者新存储的数据约为6000拍字节,这相当于十多万个美国国会图书馆的藏书量。
而在2006年,全世界的电子数据存储量还仅为18万拍字节,如今这个数字已经达到180万拍字节,短短五六年间就已经增长了一个数量级。根据预测,2015年这个数字甚至会达到天文数字般的800万拍字节。
就在此时此刻,海量数据正在源源不断地产生。每一天,无数的数据被搜集,从不停息。“过去3年里产生的数据量,比以往4万年的总和还要多,大数据时代的来临已经毋庸置疑。我们即将面临一场变革,新兴大数据将成为企业发展的当务之急,而常规技术已经难以应对拍字节级的大规模数据量。这一变化所带来的挑战,是成功的企业在未来发展过程中必须要面对的。只有那些能够运用这些新数据形态的企业,方能打造可持续的重要竞争优势。”美国奥巴马总统委员会的科学技术顾问、天睿(Teradata)公司首席技术官斯蒂芬如此总结。
数据生产力
什么样的男人更容易找到老婆?
百合网研究规划部李琦曾经对百合网上海量注册用户的头像信息进行分析,发现那些受欢迎头像照片不仅与照片主人的长相有关,同时照片上人物的表情、脸部比例、清晰度等因素也在很大程度上决定了照片主人受欢迎的程度。而那些脸部比例占照片1/2、穿着正式、眼神直视没有多余姿势的男性,更容易成为婚恋网站上的宠儿。
作为一家婚恋网站,百合网不仅需要经常做一些研究报告,分析注册用户的年龄、地域、学历、经济收入等数据,即便是每名注册用户小小的头像照片,背后也大有挖掘的价值。
让我们再放眼世界,全球市值最大的连锁餐饮企业麦当劳[微博]、零售业中的巨无霸沃尔玛、在线零售巨头亚马逊[微博],这个时代最炙手可热的三家企业,如果说它们之间存在着什么相关性的话,会是什么呢?没错,数据。
麦当劳的强大在于它卖的不仅仅是汉堡,而是在从事一个精准选址,对数据深入挖掘的“房地产生意”。而另一家早已认识到数据对创造优势的重要性,而且每年因此获得了超过预期的增长公司,则是亚马逊。它能够利用独有的客户交易数据推动定制化产品的销售和定价决策,而且其产品线的广度前所未有。这就是亚马逊一直以来能与无数零售商和电子零售商展开激烈竞争的关键优势所在。
沃尔玛更是最早通过利用大数据而受益的企业之一。其一度拥有世界上最大的数据仓库系统,通过对消费者的购物行为等数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。2007年,沃尔玛建立了一个超大的数据中心,其存储能力高达4拍字节以上。《经济学人》在2010年的一篇报道中指出,沃尔玛的数据量已经是美国国会图书馆的167倍。
而早在1969年,沃尔玛就开始使用计算机来跟踪存货,1974年就将其分销中心与各家商场运用计算机进行库存控制。1983年,沃尔玛所有门店都开始采用条形码扫描系统。1987年,沃尔玛完成了公司内部的卫星系统安装,该系统使得总部、分销中心和各个商场之间可以实现实时、双向的数据和声音传输。
采用这些在当时还是小众和超前的信息技术来搜集运营数据,为沃尔玛最近20年的崛起打下了坚实的地基。如今,在沃尔玛全世界最大的数据仓库中存储着数千家连锁店在65周内每一笔销售的详细记录,这使得业务人员可以通过分析购买行为更加了解他们的客户。
实际上,各个行业都出现了以数据分析为竞争形式的企业。这些企业当中,既有网络时代的新秀,如谷歌[微博],也有经营了百年的品牌,如宝洁。它们都在数据分析的基础上与其他企业展开竞争,同时又都是行业中的佼佼者。这两个特点是相互联系的,也就是说,正是因为这些公司大规模地采用了数据分析的方法,它们才成为行业中的领先者。
开启新商业时代的钥匙
数据已经如一股“洪流”注入了世界经济,成为全球各个经济领域的重要组成部分。麦肯锡公司预计,数据将与企业的固定资产和人力资源一样,成为生产过程中的基本要素。而在今年年初的瑞士达沃斯论坛上,一份题为《大数据,大影响》的报告同样认为,数据已经成为一种新的经济资产类别,就像货币或黄金一样。
这是大数据时代的独特现象。和其他的生产要素相比,数据无疑又具备更独特的特点。例如,工业生产过程中的原材料,一般都有排他性,但数据很容易实现共享,而且使用的人越多,其价值越大;数据也不像机器、厂房,会随着使用次数的增多而贬值,相反,重复使用反而可能使它增值。此外,此数据和彼数据如果能有机地结合到一起,可能就会产生新的信息和知识,并且实现大幅增值。
麦肯锡的报告继而指出:“已经有越来越多令人信服的证据表明:大数据将成为竞争的关键性基础,并成为下一波生产率提高、创新和为消费者创造价值的支柱。”
显然,数据的重要性已经提升到竞争性要素的高度。众所周知,信息时代的竞争,不是劳动生产率的竞争,而是知识生产率的竞争。数据是信息的载体,是知识的源泉,当然也就可以创造价值和利润。
可以预见,基于知识的竞争,将集中表现为基于数据的竞争。而这种数据竞争,将成为经济发展的必然。
美国信息经济领域的著名教授托马斯·达文波特认为,随着全球竞争的不断深化,企业的地理优势也将淡化,各种国家和地区性的保护措施也将逐步取消,一项专利很快会被模仿、复制、推广,创新将越来越艰难。但在除去这些要素之外,还有一点可以构成企业竞争的基础,那就是以“低成本、高效率”的方式来开展公司的业务。这种竞争,要求公司制定流线型的商业过程,各个过程之间必须无缝隙、无摩擦地对接,并保证每一个商业决策明智、正确,在竞争的过程中不犯错误。
而要做到这些,企业必须广泛推行以事实为基础的决策方法,大量使用数据分析来优化企业的各个运营环节,通过基于数据的优化和对接,把业务流程和觉得过程当中存在的每一分潜在的价值都挤出来,从而节约成本,战胜对手,在市场上幸存。
达文波特认为,能够始终保证自己以“数据最优”的方式运营的公司,将会在竞争中坚持到最后。因为,粗放型经营的公司最终将因“高成本”而自动出局。
事实上,这种以数据分析为竞争能力的公司都是各自领域的领袖,他们都把自己的成功归功于对数据分析的娴熟应用。全球性的竞争正在变得更加激烈,这加剧了这种需要。而在西方发达国家的公司看来,和中国、印度的竞争对手相比,他们无法在产品成本方面获得优势,但其最大优势就是能在商业过程的优化方面不战而胜。
案例:会员数据分析
顾客的消费习惯与需求,向来是零售商最重视的信息。如果你比竞争对手更早更准确地捕捉到这些信息,就可能占得先机。
塔吉特:比父亲更早知道女儿怀孕
曾经有一位男性顾客到一家塔吉特店中投诉,商店竟然给他还在读书的女儿寄婴儿用品的优惠券。这家全美第二大零售商,会搞出如此大的乌龙?但经过这位父亲与女儿进一步沟通,才发现自己女儿真的已经怀孕了。
一家零售商是如何比一位女孩的亲生父亲更早得知其怀孕消息的呢?每位顾客初次到塔吉特刷卡消费时,都会获得一组顾客识别编号
,内含顾客姓名、信用卡卡号及电子邮件等个人资料。日后凡是顾客在塔吉特消费,计算机系统就会自动记录消费内容、时间等信息。再加上从其他管道取得的统计资料,塔吉特便能形成一个庞大数据库,运用于分析顾客喜好与需求。
塔吉特的统计师们通过对孕妇的消费习惯进行一次次的测试和数据分析,得出了一些非常有用的结论:孕妇在怀孕头三个月过后会购买大量无味的润肤露;有时在头20周,孕妇会补充如钙、镁、锌等营养素;许多顾客都会购买肥皂和棉球,但当有女性除了购买洗手液和毛巾以外,还突然开始大量采购无味肥皂和特大包装的棉球时,说明她们的预产期要来了。
在塔吉特的数据库资料里,统计师们根据顾客内在需求数据,精准地选出其中的25种商品,对这25种商品进行同步分析,基本上可以判断出哪些顾客是孕妇,甚至还可以进一步估算出她们的预产期,在最恰当的时候给她们寄去最符合她们需要的优惠券,满足她们最实际的需求。依靠分析消费者数据,塔吉特的年营收从2002年的440亿美元扩大到2010年的670亿美元。这家成立于1961年的零售商能有今天的成功,数据分析功不可没。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05