
大数据时代 看天更靠谱
大数据时代,气象服务在不断地拓宽领域,从最基础的天气预报到现有的气候预测、气候可行性论证、公共气象服务、专业专项气象服务、气象防灾减灾,为社会创造财富、减轻损失;同时,大数据技术是气象服务不断创新和完善的重要支撑。
1 事实验证数据分析,“妮坦”的红色预警发对了
每个城市都有各行各业的大数据,深圳市在推进大数据发展方面已经具备一定基础,共享基础数据库建设等方面处于国内领先水平,在市场监管、交通运输、税务部门等部门的应用取得了积极成效。
在气象大数据方面,深圳市气象局与深圳先进院已合作多年。2009年,深圳市气象局与先进院高性能计算中心开始交流合作,2012年初,深圳市气象局提出预报“回南天”的研究方向,随后又提出台风精准预报、灰霾预报等新课题。
5年前,先后在加拿大麦吉尔大学、香港大学学习的李晴岚加入深圳先进院,被委派至深圳市气象局担任相关项目负责人。通过与深圳市气象局等部门合作,深圳先进院气象预报团队在台风风雨预报领域取得了显著的成果,大幅度提高了台风预报的时间、空间精度。基于这些数据,气象部门能够做出及时准确的预报预警,政府部门能够有效地组织人员疏散,最大限度地保障人民生命和财产安全。
以8月的“妮妲”为例,根据深圳先进院与市气象局合作的“近海台风引发深圳地区的风雨研究”的结论,“妮坦”台风从东南方向接近珠三角地区,距离深圳200公里左右时将引发深圳大风,全市大风起风时间在22时至24时左右,并推测深圳最大阵风将达到12-13级。
李晴岚告诉记者:“根据大数据分析结果,严格来说盐田港的最大阵风应该在27-33米/秒范围。盐田港风力一般受台风影响大,但在深圳市不一定是最大的,为安全起见,考虑深圳可能的最大阵风报12到13级比较合适,与实际观测值深圳地区在‘妮妲’影响期间的最大阵风为37米/秒高度吻合(13级风的范围在37-41.4米/秒之间)”。
市气象局依据此科研结果,综合气象预报员的专业分析,在第一时间果断对市民发出了台风红色预警,这也是深圳市气象台历史上首次发布台风红色预警。
“每一次台风到来,产生的新观测数据都会纳入数据库。”李晴岚表示,对每一种进入700公里影响范围的不同类型台风,如果数据库只有2个样本供参考,预报正确的概率是33%,如果历史上有18个类似样本供参考,预报正确的概率可以大幅提升到89%。随着样本数的增加,预报置信度就会越高。
2 从“韦森特”到“海鸥”,准确预测降水、风力
李晴岚表示,相比较为容易预测的台风路径,台风强度预报和台风风雨定量预报是世界性的预测难题。
2011年,刚从香港来深圳不久的李晴岚了解到市气象局一直在做风雨定量预报方面的研究,但一直困难重重未能出结果。大约半年后,她和团队部分解决了这个难题。
2012年7月24日,台风“韦森特”在深圳登陆,最大日降水量达到152.5毫米。在“韦森特”登陆前,李晴岚已经有了初步的研究结果,认为“韦森特”带来的日最大降水量有50%的可能性在109-191毫米之间,而降水量在100-250毫米之内被定级为大暴雨。实际观测值与预测值均为大暴雨,“韦森特”验证了李晴岚关于台风引发深圳地区降水定量预报的研究。
长期未能解决的难题为何有了转机?“最关键的是‘分类’,按照类别预估台风带来的影响。”李晴岚说,她根据台风登陆时的登陆地点、登陆距离、台风强度、登陆方位等关键特性进行划分,通过统计分析和数据挖掘的方法得出台风雨的影响程度。这是她乘坐公交车下班途中得到的灵感,经过几次与气象局专业人士的讨论尝试,半年内便有了初步的结果。
李晴岚先后在加拿大麦吉尔大学、香港大学取得了环境工程学硕士、博士学位。她从硕士开始就做数据分析、数学建模,在读博士期间研究过动力,对既注重动力也注重统计的气象研究有一定的帮助。
相比台风带来的降水预报,有关风的预报更为复杂。2014年4月,在此前一项研究的启发下,李晴岚开始着手台风对深圳地区大风影响的研究,半年内便有了初步的结果,当年9月“海鸥”登陆验证了她的研究。
“‘海鸥’中心距盐田港气象自动站的最近距离约有400公里,据以往经验,气象局认为此次台风影响不会很大,但预报员并不确定到底会引起多大的风。”按照李晴岚的预测,风力最大会达到27米/秒,时间在凌晨0时到2时之间,这与实际观测值29.1米/秒非常接近,最大风力发生时间为凌晨1时14分。
李晴岚的同事感叹道:“第二天上午气象局会商,大家都沸腾了,之前传统的气象手段还无法把距离在400公里左右的台风引起大风的时间及其强度预算得这么准。”
3 为盐田港作精细化预报,根据应用需求定课题
最近,李晴岚撰写的关于台风风雨定量预报的一篇研究论文将登上美国气象学会下的《Weather and Forecasting》杂志,这是气象预报领域的顶级期刊。
“我每周有三天都在深圳气市象局工作,与工作在一线的预报员天气会商,参加周报会,技术交流会,了解天气预报中的要点、难点;两天在深圳先进院,与同事沟通讨论、指导学生科研学习。”李晴岚告诉记者,比起理论研究,自己的研究工作更注重应用,一般是研究结果能直接应用于业务之后,才再撰写论文。
深圳盐田港是国际集装箱码头,风力条件对其码头日常货柜储运业务影响非常大,气象预报与经济利益的关联大。应对台风时如果停工过早,将造成较大损失,如果预警不及时,又可能有事故发生,因此精准的预报尤为必要。针对这种需求,李晴岚展开了重点防护单位定点精细化预报研究。
据盐田国际集装箱码头有限公司反馈给深圳先进院的信息,得益于深圳先进院研发的“近海台风引发区域性风雨预报”的技术模块——它能提前1-2天进行精细化的台风风雨影响预估,争取到更多灾害防御时间。空间精细到港区,可预估盐田港区域受台风影响的风雨特点、程度、持续时间。该模块启用后,3年来未出现因台风造成的港区人员伤亡,对盐田港业务经营和管理发挥了重要作用。
李晴岚说,气象部门掌握着丰富的第一手观测资料,他们急需把这些资料利用起来为气象预报服务。深圳先进院有着深厚的科研实力,也希望能发挥科研优势,与实际问题结合,为国计民生服务,因而才有了深圳先进院与深圳气象局的强强联合、深入合作。
据悉,深圳市气象局还通过深圳先进院与欧洲中期天气预报中心、美国俄克拉荷马大学风暴分析预报中心保持良好的合作。
记者了解到,李晴岚课题组将与深圳市气象局一起联合申报多模式集成预报系统项目,这个创意就产生自国际合作的过程中。多模式集成是指融合欧洲中心模式、日本模式、中国气象局Grapes模式,以及深圳气象局自主研发的实时同化预报系统模式的特点,发挥各自的长处,得出深圳乃至华南地区更精准的天气预报。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-07-30SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-07-30人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-07-30MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-29解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-29解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-29鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-29用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-29从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-29CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-29解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-29用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-29从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-292025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-29PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-29t 检验与 Wilcoxon 检验:数据差异分析的两大核心方法 在数据分析的广阔领域中,判断两组或多组数据之间是否存在显著差异是一项 ...
2025-07-29PowerBI 添加索引列全攻略 在使用 PowerBI 进行数据处理与分析时,添加索引列是一项极为实用的操作技巧。索引列能为数据表中的每 ...
2025-07-29