京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代的基础科学新变
今天,世界已经进入大数据时代,如何适应这样的时代、引领这样的时代,是每一个科学领域必须要面对的问题。从某种程度上说,基础科学的进展依赖于数据的获取与分析。今天,数据量爆炸式增长、数据处理工具不断改进,给基础科学带来了新机遇和新挑战。
1 大数据赋予基础研究新特征
面对大数据时代空前的数据爆炸、更复杂的经济社会需求,基础研究被赋予新的特征和功能,在促进原始性重大创新、孕育源头技术和颠覆性技术、解决社会实际问题、应对长期挑战等方面被寄予厚望
基础科学是人类对自然界基本规律认识的总和。从事基础科学问题研究的活动统称为基础科学研究,简称基础研究。基础研究自提出以来,一直都是一个比较宽泛的概念,内涵性质和关键推动因素不断丰富。也正是由于其界限模糊,才被各国政府和学者通过不同的政策含义、资助框架、制度安排和研究成果不断地重新界定。
科技界、政府和社会在不同发展阶段对基础研究有不同的认知。
1945年,美国科学家布什在《科学:无尽的前沿》中首次提出了基础研究和应用研究分类,成为“基础研究-应用研究-技术开发-商业应用”线性模式的思想源头,影响了很长一段时期主要国家的科学技术政策。
20世纪60年代,经合组织系统地开展了R&D(研究与开发)统计调查:将基础研究分为纯基础研究与定向基础研究,把定向基础研究和战略应用研究统称为战略研究。这种分类既反映了知识生产方式的融合趋势,也反映出政府研发投入对国家战略目标的关注。在接下来的几十年中,基础科学的内涵和定义也在不断发生变化。
今天,基础研究已经发展为“生态模式”,资源基础结构不断演变,驱动因素不断丰富,必然带来管理政策和评价方式的转变。
从历史发展进程看,基础研究的内涵界定都是为了适应特定阶段社会发展和政策制定的需要。传统纯基础研究活动的特征界定是:“不以任何特定的实际应用为目的,保持相对独立并由科学家按照自身意愿去开展工作。”但随着基础研究投入日益多元化以及组织模式持续变革,主要国家在鼓励科学家自由探索的同时,更加强调战略需求导向和知识的转化应用。
基础科学事关国家当前和长远战略利益,本身就是战略需求。政府支持基础研究的政策导向已经由纠正市场失灵演化为提供公共产品服务、保证经济长期繁荣发展、营造创新生态和赢得创新竞争等诸多方面。
2 数据科学改变基础科学研究范式
数据科学正以势不可当的力量席卷而来,科学界、政府和社会公众都需要重新认识大数据时代基础研究的新特征及其影响,特别是对经济社会的影响机制和战略价值
1998年度图灵奖得主吉姆·格雷于2007年初最早提出“科学方法的革命”,将科学研究分为四类范式(Paradigm,指科技界普遍遵循的科学规范和普遍运用的研究套路),依次为实验归纳,模型推演,仿真模拟和数据密集型科学发现。数据密集型科学发现以大数据为主要特征和战略资源,即“大数据科学”和“科学大数据”。大数据可以帮助科学家们打开探索未知领域的大门,科学家们将以“分析全样本、接收非精确、发现相关性”的新思维探索科学研究。
虽然大数据时代带来了思维方式等认知层面的转向,但基础科学主体的发展依然遵循物理、化学、信息、生命科学等基础学科自身的规律,并且具有交叉、融合与渗透的逻辑性。不过改变已经愈加清晰:与传统数据的科学研究相比,无论是大型望远镜列阵收集回来的各种宇宙星系图像,还是从DNA测序仪形成的各种基因组,或是社交网站的点击次数,都可以成为数据收集目标。以前需要10年才能完成的人类DNA测序,现在一天左右就能完成。基于统计机器学习、神经网络以及深度学习,人工智能的思考能力在提升,人类对未来的预测上变得前所未有地精确。
计算科学和大数据方法在提高科学发现概率、拓宽科学研究视野、促进交叉聚合的同时,也在催生新学科创新增长,使新技术研发应用变得更加快捷、简洁、高效。但是,“大数据科学”和“科学大数据”会对科学哪一领域哪一阶段的发展产生突破性影响和行业带动?大数据对基础研究的影响到底是阶段性的还是长久性的、局部的还是全面的?这些问题还并不清楚,需要引起科技界、政府和包括公众在内的更多相关者予以关注。
3 大数据时代要求基础科学组织方式与时俱进
大数据的意义并不只是海量、多样的数据,而是如何采取更合适的支持方式和支持力度将其规模大、种类多、跨界融合的特征运用到基础研究和知识转化应用之中
无论从组织方式、资助方式还是从科研行为上,大数据使传统的基础研究活动和知识生产模式呈现出了新的交叉、融合与渗透特征,不仅促进了不同领域、不同学科科学共同体的深度整合和精细分化,还促进了基础研究的推动因素和利益相关者的多样化。这些特征无疑将对基础科学的发展,尤其是给基础科学的管理及决策带来巨大影响。
在“大数据科学”和“科学大数据”的支撑下,数学、物理、生物等不同领域、学科的思维、模式、方法、工具、概念和数据交叉融合在一起,会激变产生出新的原创性发现、理论、知识、思路和方法。基础研究不再是某一学科、某一领域中的某个科研团队独立进行,科学家们可以共享不同学科、不同领域中的其他科研团队的成果数据,使用功能更加强大的研发工具,发掘更多原始性发现和新知识。事实上,这一共享不只是数据的交叉、融合,更是科学共同体内部、外部的交叉与融合,将吸引更多不同学科和领域的研究人员加入到基础研究中,使得基础研究的功能得以进一步拓展和融合。
随着大数据时代的到来,人类认知的“去等级化”转向,在本质上带来了科技创新领域的平等化趋势,虽然这一转向并不能彻底消除科技领域“马太效应”的存在,但阶层的分化会增加,层级差异会逐渐缩小。这一发展趋势必然对基础科学的资助方式、管理模式以及评价体系产生重要的影响。从无到有的原始性创新,更需要“尊重科学研究灵感瞬间性、方式随意性、路径不确定性的特点,允许科学家自由畅想、大胆假设、认真求证”。
总之,大数据时代为我国基础科学跨越式发展带来了变革性机遇和复杂性挑战。研究范式的深度改变要求我们加快建立更加包容和宽容、支持非共识创新项目的基础研究制度,鼓励变革性学术思想,促进创新治理体系从跟踪型向引领型转变。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05