京公网安备 11010802034615号
经营许可证编号:京B2-20210330
商业价值:大数据的大价值
社交媒体、物联网和电子商务的兴起,正在促使企业审视数据战略,希望从大数据分析中挖掘更多的商业价值。
2011年3月11日日本大地震发生后仅9分钟,美国国家海洋和大气管理局(NOAA)就发布了详细的海啸预警。随即,NOAA通过对海洋传感器获得的实时数据进行计算机模拟,制作的海啸影响模型出现在YouTube等网站。
NOAA的快速反应得益于其全球范围内庞大的海洋传感器网络。通过这些置于海面和海底的传感器,NOAA源源不断地获取全球范围的海洋信息,并将这些信息存储在位于美国新泽西州的数据中心。NOAA的数据中心存储着超过20Pb(1024Tb)的数据,是美国政府最大的数据库之一。
NOAA海啸研究中心首席科学家Vasily Titov事后向外界表示,“虽然预警系统发挥了很大价值,但是还没有快到足以帮助到日本仙台沿海的居民及时躲避海啸”。为了在更短时间内分析出准确的海啸活动趋势,NOAA一直在努力提升其对大数据进行处理的能力——这一机构每年的IT预算高达10亿美元。
虽然花费巨大,NOAA却对此乐此不疲,因为数据关乎生命。同样专注于大数据投入的还有很多商业机构,比如eBay、沃尔玛、中国移动等。他们大都希望从海量的大数据中,挖掘更多的商业价值,这关乎这些企业能否在大数据时代继续保持基业常青。
对于任何企业来说,数据都是其商业皇冠上最为耀眼夺目的那颗宝石。伴随着传统的商业智能系统向纵深应用的拓展,商业决策已经越来越依赖于数据。然而,传统的商业智能系统中用以分析的数据,大都是企业自身信息系统中产生的运营数据,这些数据大都是标准化、结构化的。事实上,这些数据只占到了企业所能获取的数据中很小的一部分——不到15%。
通常情况下,企业的数据可以分为3种类型:结构化数据、半结构化数据和非结构化数据。其中,85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。企业用以分析的数据越全面,分析的结果就越接近于真实。大数据分析意味着企业能够从这些新的数据中获取新的洞察力,并将其与已知业务的各个细节相融合。
IDC 在其关于大数据的报告中,阐述了利用大数据的商业价值:领军企业与其他企业之间最大的显著差别在于新数据类型的引入。那些没有引入新的分析技术和新的数据类型的企业,不太可能成为其行业的领军者。
美国奥巴马总统委员会的科学技术(PAST)顾问、Teradata公司首席技术官Stephen Brobst告诉《商业价值》记者:“过去3年里产生的数据量比以往4万年的数据量还要多,大数据时代的来临已经毋庸置疑。我们即将面临一场变革,新兴大数据将成为企业发展的当务之急,而常规技术已经难以应对Pb级的大规模数据量。这一变化所带来的挑战,是成功的企业在未来发展过程中必须要面对的。只有那些能够运用这些新数据型态的企业,方能打造可持续的重要竞争优势。”
沃尔玛是最早通过利用大数据而受益的企业之一,一度拥有世界上最大的数据仓库系统。通过对消费者的购物行为等非结构化数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。早在2007年,沃尔玛就建立了一个超大的数据中心,其存储能力高达4Pb以上。《经济学人》在2010年的一篇报道中指出,沃尔玛的数据量已经是美国国会图书馆的167倍。
中国移动集团山西有限公司通过大数据分析,对企业运营的全业务进行针对性的监控、预警、跟踪。系统在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。
“全面获取业务信息非常重要,有时候甚至能颠覆常规分析思路下做出的结论。” 中国移动集团山西有限公司业务支撑系统部经理王峰说。比如,一个客户使用最新款的诺基亚手机,每月准时缴费、平均一年致电客服3次,使用WEP和彩信业务。如果按照传统的数据分析,可能这是一位客户满意度非常高、流失概率非常低的客户。事实上,当搜集了包括微博、社交网络等新型来源的客户数据之后,这位客户的真实情况可能是这样的:客户在国外购买的这款手机,手机中的部分功能在国内无法使用,在某个固定地点手机经常断线,彩信无法使用——他的使用体验极差,正在面临流失风险。
“我们正在打破传统数据源的边界,更加注重社交媒体等新型数据来源。通过各种渠道获取尽可能多的客户信息,并从这些数据中挖掘更多的价值。”王峰说。
通过大数据进行用户行为的分析,互联网企业的起步普遍更早一些。“5年前我们就建立了大数据分析平台。在这个平台上,可以将结构化数据和非结构化数据结合在一起,通过分析促进eBay的业务创新和利润增长。” eBay分析平台高级总监Oliver Ratzesberger说。
现在,eBay的分析平台每天处理的数据量高达100PB,超过了纳斯达克交易所每天的数据处理量。为了准确分析用户的购物行为,eBay定义了超过500种类型的数据,对顾客的行为进行跟踪分析。
在早期,eBay网页上的每一个功能的更改,通常由对该功能非常了解的产品经理决定,判断的依据主要是产品经理的个人经验。而通过对用户行为数据的分析,网页上任何功能的修改都交由用户去决定。“每当有一个不错的创意或者点子,我们都会在网站上选定一定范围的用户进行测试。通过对这些用户的行为分析,来看这个创意是否带来了预期的效果。” Oliver Ratzesberger说。
更显著的变化反应在广告费上。eBay对互联网广告的投入一直很大,通过购买一些网页搜索的关键字,将潜在客户引入eBay网站。为了对这些关键字广告的投入产出进行衡量,eBay建立了一个完全封闭式的优化系统。通过这个系统,可以精确计算出每一个关键字为eBay带来的投资回报。通过对广告投放的优化,自 2007 年以来,eBay 产品销售的广告费降低了99%,顶级卖家占总销售额的百分比却上升至32%。
沃尔玛、eBay等领先企业在大数据方面的获益,毫无疑问起到了示范作用。IBM不久前发布的“全球CIO调查之CIO重要启示”指出,已经有83%的CIO拥有涵盖商业智能和分析的远期计划,并且CIO们开始更多地关注数据,而非应用。ITValue社区的调研结果也显示,57%的中国CIO对数据的关注程度超过应用。
凡此种种对于大数据的普及,确实是利好。一方面,商业智能的普及,让企业对数据的重要性已经有了充分认识;另一方面,社交媒体、电子商务、物联网等新应用的兴起,打破了企业原有价值链的围墙,仅对原有价值链各个环节的数据进行分析,已经不能满足需求。他们需要借助大数据战略打破数据边界,了解更为全面的运营及运营环境的全景图。
既然大数据关乎企业智商,那么,驾驭大数据的能力也自然成为企业的核心能力。这种能力将帮助企业寻找最优的模式支持商业决策,并确保做出接近于最优的商业决策。
但是,驾驭大数据的能力并不那么容易获得。虽然获取社交媒体、电子商务、物联网等新应用中的数据并不困难,但是传统的商业智能系统与分析软件,面对以视频、图片、文字等非结构化数据为主的大数据时,往往束手无策,缺少有效的分析工具和方法。这也为大数据的供应商们找到了更为广阔的利润增长点。
Teradata公司2011年第1季度的营收比2010年同期增长了18%。在该公司总裁兼首席执行官Mike Koehler看来,大数据需求市场的强劲表现,是营收增长的重要原来,“许多公司面临着从持续呈几何级数增长的数据中管理以及萃取数据价值的挑战。此外,网络互动、社交媒体、移动计算和传感器等来源产生的新数据元素,提供了企业利用分析推动创新和赢得竞争的新机遇。这对数据仓库的扩展性和管理复杂性提出了前所未见的极高要求,而这正是我们的擅长之处。”
为了增强在大数据分析领域的优势, Teradata还收购Aster Data公司,以增强其非传统数据分析的能力,突破了SQL分析的限制,协助企业从全部数据中获取更多价值。
EMC是另一家将大数据作为重要发展战略的IT公司。2011年EMC World上,大数据和云计算成为EMC提及频率最高的词汇。EMC希望借助在大数据和云计算两个方向的耕耘,重新定位这家传统存储厂商的未来战略。
IBM在大数据领域的优势,相比于Teradata和EMC则更为全面。IBM在硬件与软件方面的优势,在大数据解决方案上得到了延续——IBM希望提供端到端、整体的大数据解决方案。而机器人“沃森”在人机大战中获胜,更成为IBM为其大数据分析解决方案加分的例证。
此外,HP、Oracle等公司在大数据领域也有着明显的优势。从目前的态势来看,由于大数据的技术门槛较高,在大数据领域展开竞争的IT公司,大都仍然是在数据存储、分析等领域有着传统优势的厂商。
同时,随着企业客户越来越看中供应商的整体解决方案交付能力,大数据又是涉及数据的获取、存储、分析等众多技术与应用的集合。随着大数据需求的不断爆发,将加速各大IT公司在这一领域的收购步伐,一些提供单一技术方案的IT公司,很可能难逃被收购的命运。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10