
商业价值:大数据的大价值
社交媒体、物联网和电子商务的兴起,正在促使企业审视数据战略,希望从大数据分析中挖掘更多的商业价值。
对于任何企业来说,数据都是其商业皇冠上最为耀眼夺目的那颗宝石。伴随着传统的商业智能系统向纵深应用的拓展,商业决策已经越来越依赖于数据。然而,传统的商业智能系统中用以分析的数据,大都是企业自身信息系统中产生的运营数据,这些数据大都是标准化、结构化的。事实上,这些数据只占到了企业所能获取的数据中很小的一部分——不到15%。
通常情况下,企业的数据可以分为3种类型:结构化数据、半结构化数据和非结构化数据。其中,85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。企业用以分析的数据越全面,分析的结果就越接近于真实。大数据分析意味着企业能够从这些新的数据中获取新的洞察力,并将其与已知业务的各个细节相融合。
IDC 在其关于大数据的报告中,阐述了利用大数据的商业价值:领军企业与其他企业之间最大的显著差别在于新数据类型的引入。那些没有引入新的分析技术和新的数据类型的企业,不太可能成为其行业的领军者。
美国奥巴马总统委员会的科学技术(PAST)顾问、Teradata公司首席技术官Stephen Brobst告诉《商业价值》记者:“过去3年里产生的数据量比以往4万年的数据量还要多,大数据时代的来临已经毋庸置疑。我们即将面临一场变革,新兴大数据将成为企业发展的当务之急,而常规技术已经难以应对Pb级的大规模数据量。这一变化所带来的挑战,是成功的企业在未来发展过程中必须要面对的。只有那些能够运用这些新数据型态的企业,方能打造可持续的重要竞争优势。”
沃尔玛是最早通过利用大数据而受益的企业之一,一度拥有世界上最大的数据仓库系统。通过对消费者的购物行为等非结构化数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。早在2007年,沃尔玛就建立了一个超大的数据中心,其存储能力高达4Pb以上。《经济学人》在2010年的一篇报道中指出,沃尔玛的数据量已经是美国国会图书馆的167倍。
中国移动集团山西有限公司通过大数据分析,对企业运营的全业务进行针对性的监控、预警、跟踪。系统在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。
“全面获取业务信息非常重要,有时候甚至能颠覆常规分析思路下做出的结论。” 中国移动集团山西有限公司业务支撑系统部经理王峰说。比如,一个客户使用最新款的诺基亚手机,每月准时缴费、平均一年致电客服3次,使用WEP和彩信业务。如果按照传统的数据分析,可能这是一位客户满意度非常高、流失概率非常低的客户。事实上,当搜集了包括微博、社交网络等新型来源的客户数据之后,这位客户的真实情况可能是这样的:客户在国外购买的这款手机,手机中的部分功能在国内无法使用,在某个固定地点手机经常断线,彩信无法使用——他的使用体验极差,正在面临流失风险。
“我们正在打破传统数据源的边界,更加注重社交媒体等新型数据来源。通过各种渠道获取尽可能多的客户信息,并从这些数据中挖掘更多的价值。”王峰说。
通过大数据进行用户行为的分析,互联网企业的起步普遍更早一些。“5年前我们就建立了大数据分析平台。在这个平台上,可以将结构化数据和非结构化数据结合在一起,通过分析促进eBay的业务创新和利润增长。” eBay分析平台高级总监Oliver Ratzesberger说。
现在,eBay的分析平台每天处理的数据量高达100PB,超过了纳斯达克交易所每天的数据处理量。为了准确分析用户的购物行为,eBay定义了超过500种类型的数据,对顾客的行为进行跟踪分析。
在早期,eBay网页上的每一个功能的更改,通常由对该功能非常了解的产品经理决定,判断的依据主要是产品经理的个人经验。而通过对用户行为数据的分析,网页上任何功能的修改都交由用户去决定。“每当有一个不错的创意或者点子,我们都会在网站上选定一定范围的用户进行测试。通过对这些用户的行为分析,来看这个创意是否带来了预期的效果。” Oliver Ratzesberger说。
更显著的变化反应在广告费上。eBay对互联网广告的投入一直很大,通过购买一些网页搜索的关键字,将潜在客户引入eBay网站。为了对这些关键字广告的投入产出进行衡量,eBay建立了一个完全封闭式的优化系统。通过这个系统,可以精确计算出每一个关键字为eBay带来的投资回报。通过对广告投放的优化,自 2007 年以来,eBay 产品销售的广告费降低了99%,顶级卖家占总销售额的百分比却上升至32%。
沃尔玛、eBay等领先企业在大数据方面的获益,毫无疑问起到了示范作用。IBM不久前发布的“全球CIO调查之CIO重要启示”指出,已经有83%的CIO拥有涵盖商业智能和分析的远期计划,并且CIO们开始更多地关注数据,而非应用。ITValue社区的调研结果也显示,57%的中国CIO对数据的关注程度超过应用。
凡此种种对于大数据的普及,确实是利好。一方面,商业智能的普及,让企业对数据的重要性已经有了充分认识;另一方面,社交媒体、电子商务、物联网等新应用的兴起,打破了企业原有价值链的围墙,仅对原有价值链各个环节的数据进行分析,已经不能满足需求。他们需要借助大数据战略打破数据边界,了解更为全面的运营及运营环境的全景图。
既然大数据关乎企业智商,那么,驾驭大数据的能力也自然成为企业的核心能力。这种能力将帮助企业寻找最优的模式支持商业决策,并确保做出接近于最优的商业决策。
但是,驾驭大数据的能力并不那么容易获得。虽然获取社交媒体、电子商务、物联网等新应用中的数据并不困难,但是传统的商业智能系统与分析软件,面对以视频、图片、文字等非结构化数据为主的大数据时,往往束手无策,缺少有效的分析工具和方法。这也为大数据的供应商们找到了更为广阔的利润增长点。
Teradata公司2011年第1季度的营收比2010年同期增长了18%。在该公司总裁兼首席执行官Mike Koehler看来,大数据需求市场的强劲表现,是营收增长的重要原来,“许多公司面临着从持续呈几何级数增长的数据中管理以及萃取数据价值的挑战。此外,网络互动、社交媒体、移动计算和传感器等来源产生的新数据元素,提供了企业利用分析推动创新和赢得竞争的新机遇。这对数据仓库的扩展性和管理复杂性提出了前所未见的极高要求,而这正是我们的擅长之处。”
为了增强在大数据分析领域的优势, Teradata还收购Aster Data公司,以增强其非传统数据分析的能力,突破了SQL分析的限制,协助企业从全部数据中获取更多价值。
EMC是另一家将大数据作为重要发展战略的IT公司。2011年EMC World上,大数据和云计算成为EMC提及频率最高的词汇。EMC希望借助在大数据和云计算两个方向的耕耘,重新定位这家传统存储厂商的未来战略。
IBM在大数据领域的优势,相比于Teradata和EMC则更为全面。IBM在硬件与软件方面的优势,在大数据解决方案上得到了延续——IBM希望提供端到端、整体的大数据解决方案。而机器人“沃森”在人机大战中获胜,更成为IBM为其大数据分析解决方案加分的例证。
此外,HP、Oracle等公司在大数据领域也有着明显的优势。从目前的态势来看,由于大数据的技术门槛较高,在大数据领域展开竞争的IT公司,大都仍然是在数据存储、分析等领域有着传统优势的厂商。
同时,随着企业客户越来越看中供应商的整体解决方案交付能力,大数据又是涉及数据的获取、存储、分析等众多技术与应用的集合。随着大数据需求的不断爆发,将加速各大IT公司在这一领域的收购步伐,一些提供单一技术方案的IT公司,很可能难逃被收购的命运。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01