京公网安备 11010802034615号
经营许可证编号:京B2-20210330
商业价值:大数据的大价值
社交媒体、物联网和电子商务的兴起,正在促使企业审视数据战略,希望从大数据分析中挖掘更多的商业价值。
2011年3月11日日本大地震发生后仅9分钟,美国国家海洋和大气管理局(NOAA)就发布了详细的海啸预警。随即,NOAA通过对海洋传感器获得的实时数据进行计算机模拟,制作的海啸影响模型出现在YouTube等网站。
NOAA的快速反应得益于其全球范围内庞大的海洋传感器网络。通过这些置于海面和海底的传感器,NOAA源源不断地获取全球范围的海洋信息,并将这些信息存储在位于美国新泽西州的数据中心。NOAA的数据中心存储着超过20Pb(1024Tb)的数据,是美国政府最大的数据库之一。
NOAA海啸研究中心首席科学家Vasily Titov事后向外界表示,“虽然预警系统发挥了很大价值,但是还没有快到足以帮助到日本仙台沿海的居民及时躲避海啸”。为了在更短时间内分析出准确的海啸活动趋势,NOAA一直在努力提升其对大数据进行处理的能力——这一机构每年的IT预算高达10亿美元。
虽然花费巨大,NOAA却对此乐此不疲,因为数据关乎生命。同样专注于大数据投入的还有很多商业机构,比如eBay、沃尔玛、中国移动等。他们大都希望从海量的大数据中,挖掘更多的商业价值,这关乎这些企业能否在大数据时代继续保持基业常青。
对于任何企业来说,数据都是其商业皇冠上最为耀眼夺目的那颗宝石。伴随着传统的商业智能系统向纵深应用的拓展,商业决策已经越来越依赖于数据。然而,传统的商业智能系统中用以分析的数据,大都是企业自身信息系统中产生的运营数据,这些数据大都是标准化、结构化的。事实上,这些数据只占到了企业所能获取的数据中很小的一部分——不到15%。
通常情况下,企业的数据可以分为3种类型:结构化数据、半结构化数据和非结构化数据。其中,85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。企业用以分析的数据越全面,分析的结果就越接近于真实。大数据分析意味着企业能够从这些新的数据中获取新的洞察力,并将其与已知业务的各个细节相融合。
IDC 在其关于大数据的报告中,阐述了利用大数据的商业价值:领军企业与其他企业之间最大的显著差别在于新数据类型的引入。那些没有引入新的分析技术和新的数据类型的企业,不太可能成为其行业的领军者。
美国奥巴马总统委员会的科学技术(PAST)顾问、Teradata公司首席技术官Stephen Brobst告诉《商业价值》记者:“过去3年里产生的数据量比以往4万年的数据量还要多,大数据时代的来临已经毋庸置疑。我们即将面临一场变革,新兴大数据将成为企业发展的当务之急,而常规技术已经难以应对Pb级的大规模数据量。这一变化所带来的挑战,是成功的企业在未来发展过程中必须要面对的。只有那些能够运用这些新数据型态的企业,方能打造可持续的重要竞争优势。”
沃尔玛是最早通过利用大数据而受益的企业之一,一度拥有世界上最大的数据仓库系统。通过对消费者的购物行为等非结构化数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。早在2007年,沃尔玛就建立了一个超大的数据中心,其存储能力高达4Pb以上。《经济学人》在2010年的一篇报道中指出,沃尔玛的数据量已经是美国国会图书馆的167倍。
中国移动集团山西有限公司通过大数据分析,对企业运营的全业务进行针对性的监控、预警、跟踪。系统在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。
“全面获取业务信息非常重要,有时候甚至能颠覆常规分析思路下做出的结论。” 中国移动集团山西有限公司业务支撑系统部经理王峰说。比如,一个客户使用最新款的诺基亚手机,每月准时缴费、平均一年致电客服3次,使用WEP和彩信业务。如果按照传统的数据分析,可能这是一位客户满意度非常高、流失概率非常低的客户。事实上,当搜集了包括微博、社交网络等新型来源的客户数据之后,这位客户的真实情况可能是这样的:客户在国外购买的这款手机,手机中的部分功能在国内无法使用,在某个固定地点手机经常断线,彩信无法使用——他的使用体验极差,正在面临流失风险。
“我们正在打破传统数据源的边界,更加注重社交媒体等新型数据来源。通过各种渠道获取尽可能多的客户信息,并从这些数据中挖掘更多的价值。”王峰说。
通过大数据进行用户行为的分析,互联网企业的起步普遍更早一些。“5年前我们就建立了大数据分析平台。在这个平台上,可以将结构化数据和非结构化数据结合在一起,通过分析促进eBay的业务创新和利润增长。” eBay分析平台高级总监Oliver Ratzesberger说。
现在,eBay的分析平台每天处理的数据量高达100PB,超过了纳斯达克交易所每天的数据处理量。为了准确分析用户的购物行为,eBay定义了超过500种类型的数据,对顾客的行为进行跟踪分析。
在早期,eBay网页上的每一个功能的更改,通常由对该功能非常了解的产品经理决定,判断的依据主要是产品经理的个人经验。而通过对用户行为数据的分析,网页上任何功能的修改都交由用户去决定。“每当有一个不错的创意或者点子,我们都会在网站上选定一定范围的用户进行测试。通过对这些用户的行为分析,来看这个创意是否带来了预期的效果。” Oliver Ratzesberger说。
更显著的变化反应在广告费上。eBay对互联网广告的投入一直很大,通过购买一些网页搜索的关键字,将潜在客户引入eBay网站。为了对这些关键字广告的投入产出进行衡量,eBay建立了一个完全封闭式的优化系统。通过这个系统,可以精确计算出每一个关键字为eBay带来的投资回报。通过对广告投放的优化,自 2007 年以来,eBay 产品销售的广告费降低了99%,顶级卖家占总销售额的百分比却上升至32%。
沃尔玛、eBay等领先企业在大数据方面的获益,毫无疑问起到了示范作用。IBM不久前发布的“全球CIO调查之CIO重要启示”指出,已经有83%的CIO拥有涵盖商业智能和分析的远期计划,并且CIO们开始更多地关注数据,而非应用。ITValue社区的调研结果也显示,57%的中国CIO对数据的关注程度超过应用。
凡此种种对于大数据的普及,确实是利好。一方面,商业智能的普及,让企业对数据的重要性已经有了充分认识;另一方面,社交媒体、电子商务、物联网等新应用的兴起,打破了企业原有价值链的围墙,仅对原有价值链各个环节的数据进行分析,已经不能满足需求。他们需要借助大数据战略打破数据边界,了解更为全面的运营及运营环境的全景图。
既然大数据关乎企业智商,那么,驾驭大数据的能力也自然成为企业的核心能力。这种能力将帮助企业寻找最优的模式支持商业决策,并确保做出接近于最优的商业决策。
但是,驾驭大数据的能力并不那么容易获得。虽然获取社交媒体、电子商务、物联网等新应用中的数据并不困难,但是传统的商业智能系统与分析软件,面对以视频、图片、文字等非结构化数据为主的大数据时,往往束手无策,缺少有效的分析工具和方法。这也为大数据的供应商们找到了更为广阔的利润增长点。
Teradata公司2011年第1季度的营收比2010年同期增长了18%。在该公司总裁兼首席执行官Mike Koehler看来,大数据需求市场的强劲表现,是营收增长的重要原来,“许多公司面临着从持续呈几何级数增长的数据中管理以及萃取数据价值的挑战。此外,网络互动、社交媒体、移动计算和传感器等来源产生的新数据元素,提供了企业利用分析推动创新和赢得竞争的新机遇。这对数据仓库的扩展性和管理复杂性提出了前所未见的极高要求,而这正是我们的擅长之处。”
为了增强在大数据分析领域的优势, Teradata还收购Aster Data公司,以增强其非传统数据分析的能力,突破了SQL分析的限制,协助企业从全部数据中获取更多价值。
EMC是另一家将大数据作为重要发展战略的IT公司。2011年EMC World上,大数据和云计算成为EMC提及频率最高的词汇。EMC希望借助在大数据和云计算两个方向的耕耘,重新定位这家传统存储厂商的未来战略。
IBM在大数据领域的优势,相比于Teradata和EMC则更为全面。IBM在硬件与软件方面的优势,在大数据解决方案上得到了延续——IBM希望提供端到端、整体的大数据解决方案。而机器人“沃森”在人机大战中获胜,更成为IBM为其大数据分析解决方案加分的例证。
此外,HP、Oracle等公司在大数据领域也有着明显的优势。从目前的态势来看,由于大数据的技术门槛较高,在大数据领域展开竞争的IT公司,大都仍然是在数据存储、分析等领域有着传统优势的厂商。
同时,随着企业客户越来越看中供应商的整体解决方案交付能力,大数据又是涉及数据的获取、存储、分析等众多技术与应用的集合。随着大数据需求的不断爆发,将加速各大IT公司在这一领域的收购步伐,一些提供单一技术方案的IT公司,很可能难逃被收购的命运。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05