京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“数字中国”:领跑大数据时代
按照维基百科的定义,大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
“大数据除了规模大外,还有复杂的一面。”中国工程院院士毛二可向《中国科学报》记者举了个例子:比如医生要了解某种疾病在全世界有多少例,怎么治?大数据可以告诉你在某一问题上怎么做是最科学的。
毛二可的科研工作经历了在图书馆查资料、从互联网上获取信息,再到大数据分析的阶段,他认为,大数据提供了一种比过去效率提高很多倍的方法和手段。
Hadoop创始人、大数据之父Doug Cutting曾表示,本世纪我们取得的许多进展,将会来自我们对所生成数据的更多理解。
实践证明,数据驱动的科学研究已经成为新的范式,同时我们还有数据驱动产业的创新,像滴滴打车、共享单车、微信、O2O零售等,都是大数据时代的产物。
正像中国航天系统科学与工程研究院院长薛惠锋说的,在这个时代,虚拟数字空间与现实世界平行存在、精准映射、深度交融,使一切物质皆可用数据量化,一切行为皆可用数据写真,一切关联皆可用数据表征,一切趋势皆可用数据预测。
超学科人才培养是首要问题
数据是基础性资源,也是重要生产力。复旦大学教授毛扬勇表示,全球范围内,运用大数据推动经济发展、完善社会治理、提升政府服务和监管能力正成为趋势。
18年前,习近平总书记以“战略+”的高瞻远瞩,顺应互联网发展的历史潮流,在福建率先提出了“数字福建”的构想。今天,这一伟大创新不仅在八闽大地落地生根,而且上升为重大战略,“数字中国”的建设已经成为推动经济社会发展的强大引擎。
毛扬勇认为,实施国家大数据战略,是综合国际环境、技术趋势和中国形势作出的战略决策,必须把握大数据带来的战略机会,提升政府治理能力、实现经济转型升级。
“大数据要在中国强起来,第一个解决的问题就是‘人’。”毛扬勇接受《中国科学报》采访时直言,“发展大数据需要人才,而且需要我们自己来培养。”
2013年《哈佛商业评论》提出,“数据科学家是21世纪最性感的职业。”但遗憾的是,大数据人才短缺已成为全球性的问题。2012年麦肯锡曾预测,未来6年,仅在美国本土就可能面临缺乏14万至19万具备深入分析数据能力人才的情况。
“在数据学科还不成熟的情况下,不应将数据科学作为单个学科来看待。”毛扬勇表示,事实上,数据科学的广泛交叉性,决定了其人才培养的广泛交叉性。在人才培养方面要打破原有的学科限制,数据人才所需要的知识结构是涵盖和横跨不同学科,融合多学科的研究方法,甚至取代并超越它们,是一种新的视角和一种新的学习体验,即超学科。
让“大数据”化为“大智慧”
数字空间是个开放的复杂巨系统。系统之间、层次之间、地域之间、行业之间存在复杂的数据交互和关联关系,加之“人”的因素介入,使这一系统更为复杂。“这需要钱学森的开放复杂巨系统的思想。”中国工程院院士俞梦孙说。
他认为,大数据不是单纯的技术问题,“数字中国”建设过程中,一定要遵循系统科学的思想。
我们看到,互联网与大数据已经成为一类新的战略性人造资源融入到现代农业、先进制造业和服务业的创新发展过程中,极大地促进了我国供给侧结构性改革。
对此,中国中钢股份有限公司副总经理宫敬升深有体会。“泛泛地谈大数据是不行的,一定要把大数据、新的技术与传统的产业结合起来,才能有生命力。”他接受《中国科学报》采访时坦言,“作为传统产业的企业,我们对大数据和智能化是非常渴望的,希望能够依靠大数据来焕发企业的生命力。”
当前的“大数据时代”,还处在解决简单系统的初级阶段。薛惠锋认为,加快建设“数字中国”,必须保持战略清醒,不能人云亦云、亦步亦趋,要敢于颠覆、善于跨越。真正实现物理空间向“数字中国”“信息中国”“智能中国”“智慧中国”的升华,需要具备钱学森的“深、广、久、独”,让“大数据”化为“大智慧”,朝“后数据时代”迈进。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26