京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大科学开启大数据、大发现新时代
大科学是大数据的摇篮,大数据是大科学的产物
大科学的王者之道始于大数据的产生。人类历史上的大数据,源于科技领域,确切地说源于大科学研究。曼哈顿计划打开了微观世界,并开创了借用人造的大科学设施洞开微观世界的崭新科学方法论,以此为依托启动了一系列大科学计划,它们产生了史无前例的超大规模数据。如位于瑞士的欧洲核子研究中心、由全球逾8000位物理学家合作兴建的大型强子对撞机,2008年试运行后,数据量即达25PB/年,2020年建成后将达200PB/年,因此他们率先创建了“大数据”的概念。无独有偶,旨在测定人类基因组30亿碱基遗传密码的基因组计划,进行个体基因组测定时数据量即已高达13PB/年。而此计划后,学界受其鼓舞开展了一系列遗传背景迥异、不同疾病群体以及大量其他物种的基因组测序,数据量迅速逼近ZB级(是PB的百万倍),不约而同地创造了“大数据”概念。今天人们常用的互联网最初就是这些领域的科学家为解决海量数据传输而发明的。
人类理性对物质世界、人类社会和精神世界的认识,其最高境界是智慧。而要达此境界必然经过数据、信息、知识三个层阶,其中,数据是信息之母、知识之初、智慧之源。随着信息技术持续数十年的迅猛发展以及人类社会各行各业信息化的强力辐射,在人类纪元新千年的钟声敲响不久,文明世界就掀起了史无前例的大数据狂潮,其奔涌之疾,升腾之烈,不似海啸,胜似海啸。人们欢呼,因为它是摧枯拉朽、一往无前的狂飙,将以势不可挡的革命性力量,开辟新的天地;人们恐惧,因为它是行不由缰、漫无方向的野马,有着难以预想的破坏性力量。此时此刻,人类需要冷静,人类必须理性。
人类文明迄今经历了三次浪潮:第一次是农业革命,数千年前出现并持续数千年,释放出“物之力”;第二次是工业革命,数百年前出现并已持续数百年,释放出“能之力”;第三次是智业革命,数十年前开始孕育,目前正处初级阶段,将不断释放“智之力”。1980年,托夫勒预言了这次新起的文明,并明确指出这次文明将以信息化为标志。其后,恰如其料,技术与文明的信息化有如神助,在人类社会各领域、全球各地域甚至更广阔的空域天域似地火一般的点燃、普及。信息社会、信息文明似乎转眼间唾手即得,更有大数据时代的“即时”到来好像为此作了一目了然的注解。冷静分析,实则不然。数据是信息之母,没有数据,何来信息?缺乏数据的时代,怎能是名副其实的信息时代?而刚刚才来的大数据时代,恰恰表明此前是数据欠缺的“时代”。此前,人类发现、开辟的大量全新的数据空间,构建的超大型数据生产“工厂”、超大型数据仓库,建设的“信息高速公路”及其四通八达的网络,为大数据的涌现及其广泛辐射确实提供了充分的先决条件,但它们仅是大数据的摇篮,而不是摇篮里的婴儿。
从大数据向大信息升华,亟待统计科学与数据科学的革新
数据是信息之母,但再好的数据也不会自动生成信息。大数据得来不易,但转化为大信息更难,而不能转化为大信息的大数据就是横亘于人类认知之旅的理性黑洞、知性沙漠。实际上,人类理性跨过蒙昧之初,就拥有了将数据转换为信息的能力,这也是智人与直立人的分水岭。
然而,面对时下大数据时代奔涌的多元、多源、异构的海量数据,无论是被美誉为“孕育了现代科学”的统计科学,还是应大科学之运而生、当今正如日中天的数据科学,都还只能是望洋兴叹。今日之大数据,明日之大信息,扭转乾坤者,还属革新后的统计科学与数据科学。
信息虽然衍进自数据、珍贵于数据,但也只是其通向知识的中继站。知识,是人类理性认识世界的结晶,是改造世界的基石。培根在《伟大的复兴》中豪迈地预言:知识就是力量。大约400年后,人类终于迎来“知识经济时代”。知识经济,作为人类社会经济增长方式与经济发展的全新模式,被称为经济领域的哥白尼革命,其基本特征是:知识运营为经济增长方式、知识产业成为龙头产业、知识经济成为新的最活跃的经济形态。
由此可见,知识不仅是力量,而且是时代最核心、最强劲的先锋力量。但我们同时必须清醒地认识到:大数据与大知识,尚隔两重天,如将大数据比作洪水、比作奔流,它只有首先蒸发为大信息的气流,继而升腾为大知识的彩虹,才能气贯长虹、一飞冲天而成为引领知识经济时代的“巨龙”。
2015年大数据发展十大预测
1.结合智能计算的大数据分析成为热点,包括大数据与神经计算、深度学习、语义计算以及人工智能其他相关技术结合,成为大数据分析领域的热点。
2.数据科学带动多学科融合,但是数据科学作为新兴的学科,其学科基础问题体系尚不明朗,数据科学自身的发展尚未成体系。
3.跨学科领域交叉的数据融合分析与应用将成为今后大数据分析应用发展的重大趋势。
4.大数据将与物联网、移动互联、云计算、社会计算等热点技术领域相互交叉融合,产生很多综合性应用。
5.大数据多样化处理模式与软硬件基础设施逐步夯实。
6.大数据安全和隐私。
7.新的计算模式将取得突破。
8.各种可视化技术和工具提升大数据分析。
9.大数据技术课程体系建设和人才培养。
10.开源系统将成为大数据领域的主流技术和系统选择。
(资料来源:中国大数据技术大会发布的《2015大数据十大发展趋势预测》)
生命组学必将成为开启大发现新时代的领航者
毕达哥拉斯学派开启了科学的第一个大发现时代。他们集中证明:算术的本质是“绝对的不连续量”,音乐的本质是“相对的不连续量”,几何的本质是“静止的连续量”,天文学的本质是“运动的连续量”,终成“数即万物”学说。
基于第谷终身积累的海量数据,开普勒实现了对太阳系几乎所有天体运动规律的高度理论概括,因而被誉为“天空立法者”。同时期,伽利略亦通过大量观测,先后发现了运动的第一(匀速)、第二(匀加速)定律,被冠以“近代实验科学精神的创造者”。而开普勒、伽利略等的系列大发现,迅即催生了牛顿的集大成时代。一时间,牛顿力学统一了声学、光学、电磁学和热学,“万有”的牛顿定律几乎支配着小到超显微粒子、大到宇宙天体的整个物质世界。
20世纪是基因的大发现时代。1900年,孟德尔遗传定律重新发现;1910年,基因连锁定律发现;1944年证明遗传物质为DNA;1952年,DNA碱基组成定律发现;1953年DNA双螺旋模型问世,它洞开了万古遗传之谜及其遗传密码,进而揭示了统一万千生命世界的中心法则,并为人类基因组计划提供了理论与技术基础。
大科学研究,不仅开启了大数据时代,而且也光大了大发现时代。例如,人们通过大型强子对撞机,在不到5年的时间里,就实现了对“上帝粒子”(希格斯玻色子)的重大发现。希格斯玻色子的存在是最新一代大一统理论即“标准模型”的预言,而此模型是统一描述宇宙强力、弱力和电磁力这三种基本力及组成所有物质的基本粒子的理论,从而揭示了基本粒子为何拥有质量并演化为万事万物的“至理大道”,向人类破解宇宙诞生之谜迈进了一大步,因此在其发现的第二年,预言者即被授予诺贝尔奖。而此惊天大发现出自大设施、源于大科学、成于大数据、归于大智慧。它们预示着人类社会正在走向集大成的最伟大时代——智慧时代。正如莎士比亚所言:凡是过去,皆为序曲。人类的前程又到了一个新的转折点。
“人脑是自然界最复杂的系统,认知、意识、情感产生机理是自然科学的终极疆域,解读人脑成为国际科技竞争的巅峰战场”。2013年以来,集大科学、大数据、大发现之大成的“人类脑计划”相继在欧洲、北美洲、亚洲依次展开。就像曼哈顿计划、阿波罗计划开启了知识经济、信息社会、大数据时代一样,人类基因组、蛋白质组计划、脑计划正开启集大成的最伟大时代——智慧时代!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09