
选择性开放:大数据发展的必由之路
回顾2014年,大数据发展如火如荼,我们在生活中越来越多地感受到大数据应用,但我们也发现,随着大数据的发展,数据源少的问题越来越尖锐。大量的数据没有开放,这些数据或封闭性存储起来,或在专网存储难以被公网抓取利用。数据被掌控者越来越私有化,这是商业时代必不可少的一种趋势,但是,我们应该认识到这种趋势将对大数据的发展构成重大挑战。笔者认为,面向未来,国家在国计民生、科技、军事上的发展将对大数据产业提出更高的要求,要让大数据发挥更大价值,必须选择性开放大数据,这是未来几年大数据发展的振兴之路。
大数据来源于其局部的利益动力,在大数据目前局部应用的利益之外,其蕴含的经济价值受到了国家和产业的高度重视,但数据增值的关键在于数据的开放和共享,在市场经济条件下,开放和共享面临利益、隐私、安全等重大问题,需要我们分析考虑这些问题。随着大数据应用的发展,数据的价值越来越重要,国外政府数据开放与共享如火如荼,我国政府在数据开放方面也越来越重视。其原因在于大数据开放具有诸多的有利之处。
大数据开放
有助于生产力发展
大数据的规模增长迅速,据Wikibon 公司的报告,2013 年全球大数据市场总体规模为181 亿美元,年度增幅达61%,2014年,大数据市场增长速度略放缓至53%,收入达285亿美元。到2017年,全球大数据市场收入将达500亿美元,这意味着从2011年起连续六年年复合增长率达38%。中国市场情报中心CMIC显示,2012年我国大数据市场规模为4.5亿元,同比增长40.6%,到2018年,大数据市场规模将达到463.4亿元。2012~2013年度,在欧美国家1217家营业额收入超过10亿美元的企业中,643家企业制定了大数据战略,其中7%的企业至少投入了5亿美元,15%的企业至少投入了1亿美元发展大数据。
英国经济与商业研究中心(CEBR)2012 年4 月的研究报告进一步证实了大数据的价值。报告预计了2012年~2017年大数据产生的经济利益,2011年,英国私企和公共部门企业的数据资产价值为251亿英镑,2017年将达到407亿英镑;大数据增加的创新与就业机会,将贡献价值240亿英镑,同时为小企业创造的发展前景,预计价值为420 亿英镑。该报告还预测大数据将创造新业务市场,可创造58000个就业机会;通过大数据可以更有效地改进客户需求分析,预计此项优化将产生738亿英镑的效益。在供应链和物流管理方面,通过大数据优化产品存量和资源分配,可以大大降低成本,产生460亿英镑的效益。政府部门可以通过大数据对医疗保健系统进行防欺诈检测和分析,可以节省不必要的支出达20 亿英镑。可见,如果我们有意识地在更大的合理范围内开放大数据,大数据的价值将体现在更多的行业、科技和日常生活中,整个社会生产力将大大受益于这些已经验证过有效的大数据。
大数据开放
有助于人民生活便利
大数据正逐渐走进民众社会经济生活的方方面面,在科学研究、市场营销、客户服务、可持续发展、交通、医疗、教育等领域都有其用武之地。许多人相信,随着数据量的持续增长和分析工具的日益完善,大数据必将在未来社会民生中扮演重要角色。
日本著名的矢野经济研究所预测,2020年度日本大数据市场规模有望超过1兆日元。该所的报告显示,2011年度日本的大数据相关行业的市场规模为1900亿日元,2012年度约为2000亿日元,同比大约增长5%。该机构同时预测,到2013年度以后,每年度将增长20%;照此计算,到2015年度将达到4200亿日元,2017年度将达6300亿日元,2020年度将达到约1兆500亿日元。日本总务相新藤义孝提交2013年版《信息通信白皮书》估算,大数据交换量的“国内流通量”在日本2005年到2012年的7年间猛增了4.5倍,如果日本充分利用记录个人购物数据等庞大数据的“大数据”服务,零售业、制造业等4个领域有望通过促进销售和削减成本带来每年7.77万亿日元(约合人民币4800亿元)的经济效益。日本零售业可通过针对顾客购物数据发放优惠券提高销售额,或根据流行预测避免订购不必要的商品获得经济效益约1.15万亿日元。制造业可通过收集安装在设备上的传感器提供的信息减少故障等,获得约4.8万亿日元的经济效益。日本农业可通过提高稻米品质提高销售单价等获得约4000亿日元的经济效益。道路交通则可利用分析导航仪数据得出的预测结果疏堵,降低汽油支出,获得1.4万亿日元的经济效益。
2013 年1 月,英国政府向航天、医药等8 类高新技术领域注资6 亿英镑,其中大数据技术获得1.89 亿英镑,是获得资金最多的领域。其次是促进政府和公共领域的大数据应用。据测算,通过合理、高效地使用大数据技术,英国政府每年可节省约330 亿英镑,相当于英国每人每年节省约500 英镑。为了在医疗领域更好地应用大数据,2013年5月,英国政府和李嘉诚基金会联合投资设立全球首个综合运用大数据技术的医药卫生科研机构,将通过高通量生物数据,与业界共同界定药物标靶,处理目前在新药开发过程中关键的瓶颈,之后还将汇集遗传学、流行病学、临床、化学和计算机科学等领域的顶尖人才,集中分析庞大的医疗数据。
澳大利亚、新加坡等国也非常重视大数据发展。2013 年8月初,澳大利亚出台公共服务大数据政策,提出了大数据分析的实践指南,希望通过大数据分析系统提升公共服务质量,增加服务种类,为公共服务提供更好的政策指导。在新加坡政府,多个国际领先企业在当地设立大数据技术研发中心,加速数据分析技术的商业应用。2014年年初,新加坡资讯通信发展管理局(IDA)还聘请了首任首席数据科学家,专门推进政府数据的开放和价值开发。
大数据开放
有助于国家竞争力发展
事实上,日本是一个自然资源比较匮乏的国家,而资源的占有和利用是国家竞争力的体现之一。为此,日本政府绞尽脑汁挖掘自己拥有的一切资源,大数据作为一项数据资源,日本政府也倾注了大量人力予以开发和利用,期望把大数据作为提升日本竞争力的关键。
日本政府认为,提升日本竞争力,大数据应用不可或缺。2013年6月,日本政府正式公布了新IT战略——“创建最尖端IT国家宣言”。“宣言”全面阐述了2013年~2020年期间以发展开放公共数据和大数据为核心的日本新IT国家战略。日本总务省ICT基本战略委员会发布的《面向2020年的ICT综合战略》将重点关注大数据应用所需的社会化媒体等智能技术开发、传统产业IT创新、新医疗技术开发、缓解交通拥堵等公共领域应用等。日本总务省2012年7月推出了新的综合战略“活力ICT 日本”,将重点关注大数据应用,并将其作为2013 年六个主要任务之一,聚焦大数据应用所需的、社会化媒体等智能技术开发,以及在新医疗技术开发、缓解交通拥堵等公共领域的应用。
美欧政府也在军事领域大量使用大数据,并在现代的海湾战争中加以试验,提升国家竞争力的意图显露无遗。中国政府也意识到了这一点,但作为一项全民意识还有待时日。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19