京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 广州超算能否成为创新“新引擎”
2014年底,全球超级计算机TOP500组织在美国正式发布了全球超级计算机500强最新排行榜,广州超算中心“天河二号”超级计算机,以每秒33.86千万亿次的浮点运算速度,第四次摘得全球运行速度最快的超级计算机桂冠。2015年底,“天河二号”将提供每秒11亿亿次高性能计算机系统。
大数据时代,广州超算能否成为创新“新引擎”?近日,笔者采访了国家超级计算广州中心(以下简称广州超算中心)“天河二号”研究团队及相关人员,以探寻国之重器“天河二号”背后的故事。
依靠大数据提升原始创新能力
在位于中山大学东校区的国家超级计算广州中心。笔者看到占地约800平方米,由170个机柜组成的“天河二号”。
“如果把普通计算机的运算速度比做成人走路,那么超级计算机就达到了火箭的速度。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。就拿‘天河二号’来说,13亿人用计算器算1000年才能达到‘天河二号’1小时的计算量。”广州超级计算中心常务副主任卢泽新说。
国家超级计算广州中心于2013年11月由国家科技部正式授牌,总投资超过25亿元人民币,是国家“十二五”“863计划”重大科技项目,由广东省政府、广州市政府、国防科学技术大学、中山大学四方共同建设。
卢泽新自豪地说:“‘天河二号’是当今世界上运算速度最快的超级计算机,综合技术处于国际领先水平。它有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录。二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平。三是应用广,主打科学工程计算,兼顾了云计算。四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性。五是性价比高。”
近年来,广东加快珠三角大科学工程创新体系建设步伐,积极争取国家重大科技基础设施建设项目落户广东,通过推进重大科技基础设施建设应用,加快提升原始创新能力。
在卢泽新看来,强大的计算能力将更好的支撑大科学问题的研究。近5年来,获得Gor-don Bell奖的超算应用所需要的计算资源都超过了1P,2013年获得Gordon Bell奖的超算应用甚至实现了14P的计算峰值,占用了红杉(位于美国劳伦斯利弗莫国家实验室的超级计算机,目前计算能力排名世界第三)约73%的计算资源。由此可见,大科学问题的研究对计算能力提出了更高的要求,只有“天河二号”这样具有强大计算能力的超级计算机,才能更好的支撑大科学问题研究的计算需求,“大数据时代的到来,超级计算机的作用将会凸显”。
卢泽新介绍,广州超算中心“天河二号”主机系统的设计计算能力为110P,目前一期系统已经达到54.9P,远远超过天津(4.7P)、深圳(1.3P)、长沙(1.4P)和济南(1.1P)等超算中心主机系统的计算能力。超级计算机可广泛应用于高新产业和现代服务业、数字城市建设及科研等多种领域,成为融高性能计算、海量数据处理、信息管理服务于一体的世界一流的超级计算中心,为广州、广东乃至华南地区的经济社会发展提供强大引擎。
运用超算中心为产业升级服务
然而无论是中国还是欧美、日本等超算大国,在超算中心商业化的问题上都遇到了困难,几乎所有的超算中心都需要政府的财政支持。对于“天河二号”这样庞大的系统来说,如何让它为产业升级服务而实现商业化?
广州超级计算中心主任袁学锋认为,目前世界上都在酝酿着所谓的第三次产业革命,其核心的内容就是如何把信息技术的大数据向制造业、实体经济辐射。所以如何利用大数据将信息技术转化为生产力,是广州超算中心在应用方面的核心内容,这也是衡量一个国家创新型经济竞争能力的核心内容。
以当下热门的3D打印为例,就是通过材料实现了对制造业的颠覆性创新,从这一点来说广州超算中心可以提供在材料和制造方面的高性能计算能力。
让袁学锋格外得意的是,目前广州超算中心已经与世界领先的基因公司华大基因展开基于基因科学的合作内容,将医疗与基因工程集成化、个性化。“这其中牵扯大数据、高性能计算的东西,还有云计算技术等多项内容,广州超算中心则负责所有数据的汇总与分析。”
另外,中国商飞(中国商用飞机有限责任公司)已经在天河二号上实现了C919的运行模拟,这是一款与波音737类似的中型客机。
除此之外,广州超算中心还负责广东省的政务云系统,包括电子政务、电子教育、电子医疗、电子环境、电子灾害预报等内容都将在“天河二号”上实现。
“天河二号”作为广州超算中心的主机,如今它的运用已渗入广州多个产业。卢泽新介绍,广汽研究院也是“天河二号”的用户,以该院汽车设计为例,在超级计算机的帮助下,原来需要两至三年的新车型设计,缩短到5个月完成,并可模拟实现优化设计、防撞性能测试,大大节约了成本。
“智慧城市的建设也可以用到‘超算’。广州有20万个摄像头,过去处于有事才找视频的状态,现在有关部门正与超算中心合作对这些信息进行管理、控制,进行数据分析后再加以利用,这将对城市建设产生很大帮助。”卢泽新表示。
随着软件技术开发的国际化,“天河二号”云服务应用收获积极成效。截至目前,云平台共有用户约20家。部分机柜与应用单位通过专线连接,为用户提供了高安全等级资源服务。主要服务领域包括:电子政务应用——已适配完成了广州市政府网站群、电子政务数据交换平台等应用,目前正在支持中山市电子政务应用,同时作为省级教育数据中心主要资源池,广州超算中心将为各类教育管理系统提供所需计算和存储资源;动漫渲染应用——为动漫产业提供海量的计算资源,目前正在支持华强、奥飞、酷卡等多个用户的渲染业务。
卢泽新表示,广州在“天河二号”的开发过程中,还将在番禺南沙等地,建立超算分中心,利用光纤与位于大学城的主中心连接,更贴近的满足企业实时运算需求。
呼吁政府补助中小企业上机费用
卢泽新认为,数据开放可充分利用蕴藏着的社会能量,调动大众的智慧。数据是知识生产和创新的资源,通过互联网开放数据,就是将原来由部分社会精英垄断的知识和创新资源,开放给大众,进一步调动大众智慧,推动大众创新。每个人贡献一点点,大数据就可能还原事件的真相,或者推动某种创新。例如,开源项目、开源社区、开放性创新联盟组织的兴起,有效降低了产业技术的壁垒,推动更多的创业者介入。因此大数据时代“国之重器”应该大展身手。
然而自2013年以来,大数据应用基本上还是自发状,并没有形成燎原之势。大数据现有技术水平的主要受益产业仍然主要是云计算的科研。用卢泽新的话来说,超级计算机可以“算天”“算地”“算人”,但最为迫切的是把它运用到为经济服务上。在产业升级方面,大数据的市场发展前景是非常广阔的。珠三角以及港澳地区,均有大量的数据运算需求。以广州地区为例,共有规模以上医药企业86家,产值近180亿元,均拥有极高的药理试验性数据运算需求。
笔者在调查中了解到,虽然“天河二号”的资源是完全向社会开放的,包括中小微企业等用户,如果有超算的需要,未来都可在国家超算广州中心的网页上进行申请,提交课题。但因为费用门槛,中小企业申请者寥寥。
缺乏核心技术、产品附加值低是广州实施创新驱动的短板。如今广州在大数据领域拥有了“天河二号”,将迎来了突破核心技术短板的机会。未来的工业发展模式是信息技术与工业技术的高度融合,是网络、计算机、数据信息、软件与自动化技术的深度交织。广州制造业基于过去30年发展已积累了一定的技术基础和研发能力,抓住大数据这一机遇,完全有可能实现战略性的重点突破、重点跨越,在制造业上实现创新驱动发展。
袁学锋希望,政府对有需要的中小企业提供上机费用补助。“只有当超级计算机的能力为社会广泛应用时,人人可以公平自由参与、竞争合作、创造分享,大数据时代才能发挥它应有的作用。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22