京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 广州超算能否成为创新“新引擎”
2014年底,全球超级计算机TOP500组织在美国正式发布了全球超级计算机500强最新排行榜,广州超算中心“天河二号”超级计算机,以每秒33.86千万亿次的浮点运算速度,第四次摘得全球运行速度最快的超级计算机桂冠。2015年底,“天河二号”将提供每秒11亿亿次高性能计算机系统。
大数据时代,广州超算能否成为创新“新引擎”?近日,笔者采访了国家超级计算广州中心(以下简称广州超算中心)“天河二号”研究团队及相关人员,以探寻国之重器“天河二号”背后的故事。
依靠大数据提升原始创新能力
在位于中山大学东校区的国家超级计算广州中心。笔者看到占地约800平方米,由170个机柜组成的“天河二号”。
“如果把普通计算机的运算速度比做成人走路,那么超级计算机就达到了火箭的速度。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。就拿‘天河二号’来说,13亿人用计算器算1000年才能达到‘天河二号’1小时的计算量。”广州超级计算中心常务副主任卢泽新说。
国家超级计算广州中心于2013年11月由国家科技部正式授牌,总投资超过25亿元人民币,是国家“十二五”“863计划”重大科技项目,由广东省政府、广州市政府、国防科学技术大学、中山大学四方共同建设。
卢泽新自豪地说:“‘天河二号’是当今世界上运算速度最快的超级计算机,综合技术处于国际领先水平。它有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录。二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平。三是应用广,主打科学工程计算,兼顾了云计算。四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性。五是性价比高。”
近年来,广东加快珠三角大科学工程创新体系建设步伐,积极争取国家重大科技基础设施建设项目落户广东,通过推进重大科技基础设施建设应用,加快提升原始创新能力。
在卢泽新看来,强大的计算能力将更好的支撑大科学问题的研究。近5年来,获得Gor-don Bell奖的超算应用所需要的计算资源都超过了1P,2013年获得Gordon Bell奖的超算应用甚至实现了14P的计算峰值,占用了红杉(位于美国劳伦斯利弗莫国家实验室的超级计算机,目前计算能力排名世界第三)约73%的计算资源。由此可见,大科学问题的研究对计算能力提出了更高的要求,只有“天河二号”这样具有强大计算能力的超级计算机,才能更好的支撑大科学问题研究的计算需求,“大数据时代的到来,超级计算机的作用将会凸显”。
卢泽新介绍,广州超算中心“天河二号”主机系统的设计计算能力为110P,目前一期系统已经达到54.9P,远远超过天津(4.7P)、深圳(1.3P)、长沙(1.4P)和济南(1.1P)等超算中心主机系统的计算能力。超级计算机可广泛应用于高新产业和现代服务业、数字城市建设及科研等多种领域,成为融高性能计算、海量数据处理、信息管理服务于一体的世界一流的超级计算中心,为广州、广东乃至华南地区的经济社会发展提供强大引擎。
运用超算中心为产业升级服务
然而无论是中国还是欧美、日本等超算大国,在超算中心商业化的问题上都遇到了困难,几乎所有的超算中心都需要政府的财政支持。对于“天河二号”这样庞大的系统来说,如何让它为产业升级服务而实现商业化?
广州超级计算中心主任袁学锋认为,目前世界上都在酝酿着所谓的第三次产业革命,其核心的内容就是如何把信息技术的大数据向制造业、实体经济辐射。所以如何利用大数据将信息技术转化为生产力,是广州超算中心在应用方面的核心内容,这也是衡量一个国家创新型经济竞争能力的核心内容。
以当下热门的3D打印为例,就是通过材料实现了对制造业的颠覆性创新,从这一点来说广州超算中心可以提供在材料和制造方面的高性能计算能力。
让袁学锋格外得意的是,目前广州超算中心已经与世界领先的基因公司华大基因展开基于基因科学的合作内容,将医疗与基因工程集成化、个性化。“这其中牵扯大数据、高性能计算的东西,还有云计算技术等多项内容,广州超算中心则负责所有数据的汇总与分析。”
另外,中国商飞(中国商用飞机有限责任公司)已经在天河二号上实现了C919的运行模拟,这是一款与波音737类似的中型客机。
除此之外,广州超算中心还负责广东省的政务云系统,包括电子政务、电子教育、电子医疗、电子环境、电子灾害预报等内容都将在“天河二号”上实现。
“天河二号”作为广州超算中心的主机,如今它的运用已渗入广州多个产业。卢泽新介绍,广汽研究院也是“天河二号”的用户,以该院汽车设计为例,在超级计算机的帮助下,原来需要两至三年的新车型设计,缩短到5个月完成,并可模拟实现优化设计、防撞性能测试,大大节约了成本。
“智慧城市的建设也可以用到‘超算’。广州有20万个摄像头,过去处于有事才找视频的状态,现在有关部门正与超算中心合作对这些信息进行管理、控制,进行数据分析后再加以利用,这将对城市建设产生很大帮助。”卢泽新表示。
随着软件技术开发的国际化,“天河二号”云服务应用收获积极成效。截至目前,云平台共有用户约20家。部分机柜与应用单位通过专线连接,为用户提供了高安全等级资源服务。主要服务领域包括:电子政务应用——已适配完成了广州市政府网站群、电子政务数据交换平台等应用,目前正在支持中山市电子政务应用,同时作为省级教育数据中心主要资源池,广州超算中心将为各类教育管理系统提供所需计算和存储资源;动漫渲染应用——为动漫产业提供海量的计算资源,目前正在支持华强、奥飞、酷卡等多个用户的渲染业务。
卢泽新表示,广州在“天河二号”的开发过程中,还将在番禺南沙等地,建立超算分中心,利用光纤与位于大学城的主中心连接,更贴近的满足企业实时运算需求。
呼吁政府补助中小企业上机费用
卢泽新认为,数据开放可充分利用蕴藏着的社会能量,调动大众的智慧。数据是知识生产和创新的资源,通过互联网开放数据,就是将原来由部分社会精英垄断的知识和创新资源,开放给大众,进一步调动大众智慧,推动大众创新。每个人贡献一点点,大数据就可能还原事件的真相,或者推动某种创新。例如,开源项目、开源社区、开放性创新联盟组织的兴起,有效降低了产业技术的壁垒,推动更多的创业者介入。因此大数据时代“国之重器”应该大展身手。
然而自2013年以来,大数据应用基本上还是自发状,并没有形成燎原之势。大数据现有技术水平的主要受益产业仍然主要是云计算的科研。用卢泽新的话来说,超级计算机可以“算天”“算地”“算人”,但最为迫切的是把它运用到为经济服务上。在产业升级方面,大数据的市场发展前景是非常广阔的。珠三角以及港澳地区,均有大量的数据运算需求。以广州地区为例,共有规模以上医药企业86家,产值近180亿元,均拥有极高的药理试验性数据运算需求。
笔者在调查中了解到,虽然“天河二号”的资源是完全向社会开放的,包括中小微企业等用户,如果有超算的需要,未来都可在国家超算广州中心的网页上进行申请,提交课题。但因为费用门槛,中小企业申请者寥寥。
缺乏核心技术、产品附加值低是广州实施创新驱动的短板。如今广州在大数据领域拥有了“天河二号”,将迎来了突破核心技术短板的机会。未来的工业发展模式是信息技术与工业技术的高度融合,是网络、计算机、数据信息、软件与自动化技术的深度交织。广州制造业基于过去30年发展已积累了一定的技术基础和研发能力,抓住大数据这一机遇,完全有可能实现战略性的重点突破、重点跨越,在制造业上实现创新驱动发展。
袁学锋希望,政府对有需要的中小企业提供上机费用补助。“只有当超级计算机的能力为社会广泛应用时,人人可以公平自由参与、竞争合作、创造分享,大数据时代才能发挥它应有的作用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05