京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据战略、管理与生态
大数据这个话题,从西到东,从IT业内到政府官员,已经火了两年,但还没有完全一致的定义。目前业界一般认同Gartner的描述,即:凡是具有“3V”特性的数据集,就是大数据。其一为Volume,极大的数据量;其二为Variety,极复杂的数据类型与数据来源;其三为VelocITy,极高的数据产生、传播,以及反应速度。
在我看来,组织决策者要跨越大数据时代的“数据鸿沟”,就需要具备大数据战略、大数据管理和大数据生态三大能力。
大数据战略:视野,观点,价值
大数据的价值已经为电商、快消、广告等多个行业的案例所证明,但挖掘出大数据的价值并不容易。我认为,企业决策者在制定大数据战略时,需要从Vision(视野)、View(观点)、Value(价值)这“新3V”入手。
第一点从视野讲,企业CEO一定要把大数据、云计算作为企业核心战略,而不能仅仅把大数据当成是企业IT管理的一个方面。要下决心投入,无论软件方面还是硬件设施。
第二是要有企业自己的观点,即收集和处理数据的策略。例如股市,大家很多时候面对同样的数据,但是对数据的处理方式是不一样的,有些人说股市下行时候投入,有些人说股市下行时候要撤出。对同样的数据,甚至同样的软件,决策方式、观点不一样,处理结果就会大大不同,这个应该成为公司决策体系的一个核心。
第三是价值,要在确定思路后,把对数据的分析,转化为能解决实际问题的执行,从而实现大数据的价值。正如马云最近所举的例子,在淘宝上比基尼卖得最好的省份是哪儿?是内蒙古和新疆,而不是人们通常会认为的海南、广东等沿海地区。大数据能帮助人们发现事物间隐藏的内在关联,但并不意味着能直接带来社会和商业价值。如果你是泳衣、防晒霜的生产商,又会制定怎样的营销策略呢?
大数据管理:简易、开放、灵活
大数据战略重要,但更重要的是如何执行,也就是大数据管理问题。也可以通过三步走的方式来解决。首先是如何获取、存储和保护数据;其二是数据丰富,即如何清洗、发现不同数据间的数据相关性;其三是数据洞察力,即通过分析、呈现与决策工具获得洞察力,并最终通过付诸行动,产生价值。
微软的大数据管理平台,有着对大数据生命周期的全方位考虑,这也是为什么我们将Hadoop等开源架构,整合到微软的大数据平台里,一方面是将Hadoop作为对非关系型数据处理的补充;另一方面是将Hadoop作为一个服务,整合到微软的公有云与私有云平台中。值得强调的是,微软不是简单地将Hadoop迁移到微软的大数据平台上,而是真正的融合,会系统地考虑其可用性、可靠性、安全性、部署的简易性与灵活性,乃至对Hadoop上工具的集成与优化。与此同时,微软也会坚持开源的原则,将在Hadoop上做的一些研发工作回馈给社区,与社区形成良性互动。
大数据生态:平台商、数据商、开发者、数据玩家
未来的大数据生态,同样会遵循最朴素的市场规则,不同角色的组织和个人,通过逐渐成熟的交换机制,各取所需——平台商提供数据交易、数据分析的场所和基本工具。
原始数据商提供自由交易的数据集;开发者提供基于数据集的应用和服务,以及定制化的分析和呈现工具;数据玩家如同股民,在市场中寻找值得投资的数据集或者机构进行投资,获得回报;现在人们炒房、炒股、炒黄金,将来或许人们会炒数据。
微软已经通过Windows
Azure上的Marketplace在进行这样的尝试,目前主要针对的是商业用户,已经能将第三方解决方案提供商、服务提供商、模块提供商和最终的商业用户通过这一虚拟市场联结在一起,可以发起自由交易。在这个基础上,我们又延伸出一个数据集市,让数据集的拥有者可以把数据发布到集市上,提供很多很细致的数据集,小到电影院座位和路况,大到国家宏观经济发展数据。这就能让开发者可以通过微软的一些简单易用的API或者工具,把这些数据整合到自己的环境里,开发新的应用。
这样的大数据生态显然是健康、可持续的。对微软、亚马逊、谷歌、VMware这样的平台商而言,专心做好底层云计算基础架构和大数据服务平台;对淘宝、中国移动、政府各部委这样的数据商来说,原本只能自己用的数据,在这个模式下可以产生更多的社会和商业价值;对Salesforce、SAP、用友、金蝶等应用开发商来说,传统的、非常困难的、非常繁琐的数据整合,现在通过这样一个集市,可以首次实现把不同应用系统产生的数据整合起来,发现价值;对数据玩家来说,能够有一个朝阳式的投资平台可供选择,且不那么容易被大机构操纵。
当数据公开、数据交易和大数据应用成为自然而然的习惯时,或许我们才可以说,大数据时代真的来临了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05