京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据之和的价值远大于数据的价值之和
在宽带化、移动互联网、物联网、社交网络、云计算的催生下,一个大数据的时代,不经意间顺理成章地翩然而至。不久前,沣西大数据产业园悄然落户陕西省西咸新区,发展大数据产业正在“试水”。
全球数据总量在以每两年翻一番的速度增长
从事广告文化创意行业的何先生,清晰地记得,从12年前购买的仅有20GB硬盘容量的家用计算机,到为满足使用需求而不断扩容的80GB、120GB、250GB、500GB的主机存储空间,变化很快。“如今2TB的硬盘都不够用,还得靠移动存储设备来备份。”
根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,1.8ZB也就相当于18亿个1TB的移动硬盘),而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。
由于数据规模的急剧膨胀,各行业累积的数据量越来越巨大,数据类型也越来越多、越来越复杂,已经超越了传统数据管理系统、处理模式的能力范围,于是“大数据”这样一个在含义上趋近于“无穷大”的概念才会应运而生。
“首先在于体量大,是一个数据全集的概念”,国家工信部软件服务业司司长陈伟为大数据概括出四方面特征,“第二是类型多,包括结构化数据、半结构化数据、非结构化数据等多种类型,其中视频数据在目前占到了90%以上的总额;第三要求速度快,需要以秒级为目标进行实时动态处理。”
“最后在于价值密度”,陈伟认为,由于大量有用和可能没用的数据并存,“遍地是金子,又遍地是沙子”,所以大数据的目的就在于从庞大的数据集合中找寻有价值的数据和知识,通过分析挖掘为各行业提供真正的智慧,“可以说21世纪是‘数据钻出石油’的时代。”
“以交互数据为例,目前一些自媒体平台,比如新浪微博,每天都有超过2500万条的微博信息在发布,里面有很多有价值的信息尚未得到发掘”,中国电子信息产业发展研究院副总工程师李峻认为,在这样庞大的非结构化数据背后,如何利用大数据技术,从海量堆积的交互数据当中发现带有趋势性、前瞻性的讯息,就能够发现并产生巨大的社会价值和商业价值。
一个小苹果背后的大数据:数据之和的价值远大于数据的价值之和
“由于数据的存储、分析、应用等方面的商业运营方式还没有定型,这个行业发展的潜力、创新空间都十分巨大”,陕西省西咸新区管委会副主任、沣西新城管委会主任刘宇斌打了一个“小苹果背后的大数据”的简单比方:
以陕西省苹果产业发展为例,诸如某品种苹果种在哪里最适宜生长所需要的空间地理信息数据,与具体产区的苹果产量、含糖量等数据叠加,并通过物联网等手段赋予苹果可追溯的唯一“身份”,在种植过程中实时监控,由每一个苹果“反馈”收集而成的数据,假如足够海量,就整合而成了大数据。
拥有了这些数据,首先可以通过数据租售服务的方式与潜在客户产生价值,“此类商业模式体现了数据之和的价值远远大于数据的价值之和。”
其次,如能运用组群分析、数据挖掘等科学方法,辅以云计算、分布式存储等手段,则可以对数据展开深层次分析和预测服务,“哪些苹果品质最好,市场反应更好,明年产量销量会怎样,各地市场对苹果购买的喜好会有何变化”,这种数据深挖及其背后的消费者行为预测分析,曾是统计学家的特权,未来则可能花费几分钟时间就可以完成。
数据经过积累,并与全国其他地方进行比对,则可为陕西苹果产业发展提供决策支持服务,并成为政府、行业指导果农生产的决策依据,避免产品滞销和果农利益受损。
最后,随着数据和分析方法共识性的建立,数据服务商有可能搭建一个第三方大数据分析平台,为更多的数据持有者提供数据整理、过滤、分析和处理服务,甚至有朝一日发展出类似于ebay、淘宝等电子商务交易平台一样的第三方数据共享交易平台。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15