京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“数字中国”:领跑大数据时代
按照维基百科的定义,大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
“大数据除了规模大外,还有复杂的一面。”中国工程院院士毛二可向《中国科学报》记者举了个例子:比如医生要了解某种疾病在全世界有多少例,怎么治?大数据可以告诉你在某一问题上怎么做是最科学的。
毛二可的科研工作经历了在图书馆查资料、从互联网上获取信息,再到大数据分析的阶段,他认为,大数据提供了一种比过去效率提高很多倍的方法和手段。
Hadoop创始人、大数据之父Doug Cutting曾表示,本世纪我们取得的许多进展,将会来自我们对所生成数据的更多理解。
实践证明,数据驱动的科学研究已经成为新的范式,同时我们还有数据驱动产业的创新,像滴滴打车、共享单车、微信、O2O零售等,都是大数据时代的产物。
正像中国航天系统科学与工程研究院院长薛惠锋说的,在这个时代,虚拟数字空间与现实世界平行存在、精准映射、深度交融,使一切物质皆可用数据量化,一切行为皆可用数据写真,一切关联皆可用数据表征,一切趋势皆可用数据预测。
超学科人才培养是首要问题
数据是基础性资源,也是重要生产力。复旦大学教授毛扬勇表示,全球范围内,运用大数据推动经济发展、完善社会治理、提升政府服务和监管能力正成为趋势。
18年前,习近平总书记以“战略+”的高瞻远瞩,顺应互联网发展的历史潮流,在福建率先提出了“数字福建”的构想。今天,这一伟大创新不仅在八闽大地落地生根,而且上升为重大战略,“数字中国”的建设已经成为推动经济社会发展的强大引擎。
毛扬勇认为,实施国家大数据战略,是综合国际环境、技术趋势和中国形势作出的战略决策,必须把握大数据带来的战略机会,提升政府治理能力、实现经济转型升级。
“大数据要在中国强起来,第一个解决的问题就是‘人’。”毛扬勇接受《中国科学报》采访时直言,“发展大数据需要人才,而且需要我们自己来培养。”
2013年《哈佛商业评论》提出,“数据科学家是21世纪最性感的职业。”但遗憾的是,大数据人才短缺已成为全球性的问题。2012年麦肯锡曾预测,未来6年,仅在美国本土就可能面临缺乏14万至19万具备深入分析数据能力人才的情况。
“在数据学科还不成熟的情况下,不应将数据科学作为单个学科来看待。”毛扬勇表示,事实上,数据科学的广泛交叉性,决定了其人才培养的广泛交叉性。在人才培养方面要打破原有的学科限制,数据人才所需要的知识结构是涵盖和横跨不同学科,融合多学科的研究方法,甚至取代并超越它们,是一种新的视角和一种新的学习体验,即超学科。
让“大数据”化为“大智慧”
数字空间是个开放的复杂巨系统。系统之间、层次之间、地域之间、行业之间存在复杂的数据交互和关联关系,加之“人”的因素介入,使这一系统更为复杂。“这需要钱学森的开放复杂巨系统的思想。”中国工程院院士俞梦孙说。
他认为,大数据不是单纯的技术问题,“数字中国”建设过程中,一定要遵循系统科学的思想。
我们看到,互联网与大数据已经成为一类新的战略性人造资源融入到现代农业、先进制造业和服务业的创新发展过程中,极大地促进了我国供给侧结构性改革。
对此,中国中钢股份有限公司副总经理宫敬升深有体会。“泛泛地谈大数据是不行的,一定要把大数据、新的技术与传统的产业结合起来,才能有生命力。”他接受《中国科学报》采访时坦言,“作为传统产业的企业,我们对大数据和智能化是非常渴望的,希望能够依靠大数据来焕发企业的生命力。”
当前的“大数据时代”,还处在解决简单系统的初级阶段。薛惠锋认为,加快建设“数字中国”,必须保持战略清醒,不能人云亦云、亦步亦趋,要敢于颠覆、善于跨越。真正实现物理空间向“数字中国”“信息中国”“智能中国”“智慧中国”的升华,需要具备钱学森的“深、广、久、独”,让“大数据”化为“大智慧”,朝“后数据时代”迈进。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22