京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 看天更靠谱
大数据时代,气象服务在不断地拓宽领域,从最基础的天气预报到现有的气候预测、气候可行性论证、公共气象服务、专业专项气象服务、气象防灾减灾,为社会创造财富、减轻损失;同时,大数据技术是气象服务不断创新和完善的重要支撑。
1 事实验证数据分析,“妮坦”的红色预警发对了
每个城市都有各行各业的大数据,深圳市在推进大数据发展方面已经具备一定基础,共享基础数据库建设等方面处于国内领先水平,在市场监管、交通运输、税务部门等部门的应用取得了积极成效。
在气象大数据方面,深圳市气象局与深圳先进院已合作多年。2009年,深圳市气象局与先进院高性能计算中心开始交流合作,2012年初,深圳市气象局提出预报“回南天”的研究方向,随后又提出台风精准预报、灰霾预报等新课题。
5年前,先后在加拿大麦吉尔大学、香港大学学习的李晴岚加入深圳先进院,被委派至深圳市气象局担任相关项目负责人。通过与深圳市气象局等部门合作,深圳先进院气象预报团队在台风风雨预报领域取得了显著的成果,大幅度提高了台风预报的时间、空间精度。基于这些数据,气象部门能够做出及时准确的预报预警,政府部门能够有效地组织人员疏散,最大限度地保障人民生命和财产安全。
以8月的“妮妲”为例,根据深圳先进院与市气象局合作的“近海台风引发深圳地区的风雨研究”的结论,“妮坦”台风从东南方向接近珠三角地区,距离深圳200公里左右时将引发深圳大风,全市大风起风时间在22时至24时左右,并推测深圳最大阵风将达到12-13级。
李晴岚告诉记者:“根据大数据分析结果,严格来说盐田港的最大阵风应该在27-33米/秒范围。盐田港风力一般受台风影响大,但在深圳市不一定是最大的,为安全起见,考虑深圳可能的最大阵风报12到13级比较合适,与实际观测值深圳地区在‘妮妲’影响期间的最大阵风为37米/秒高度吻合(13级风的范围在37-41.4米/秒之间)”。
市气象局依据此科研结果,综合气象预报员的专业分析,在第一时间果断对市民发出了台风红色预警,这也是深圳市气象台历史上首次发布台风红色预警。
“每一次台风到来,产生的新观测数据都会纳入数据库。”李晴岚表示,对每一种进入700公里影响范围的不同类型台风,如果数据库只有2个样本供参考,预报正确的概率是33%,如果历史上有18个类似样本供参考,预报正确的概率可以大幅提升到89%。随着样本数的增加,预报置信度就会越高。
2 从“韦森特”到“海鸥”,准确预测降水、风力
李晴岚表示,相比较为容易预测的台风路径,台风强度预报和台风风雨定量预报是世界性的预测难题。
2011年,刚从香港来深圳不久的李晴岚了解到市气象局一直在做风雨定量预报方面的研究,但一直困难重重未能出结果。大约半年后,她和团队部分解决了这个难题。
2012年7月24日,台风“韦森特”在深圳登陆,最大日降水量达到152.5毫米。在“韦森特”登陆前,李晴岚已经有了初步的研究结果,认为“韦森特”带来的日最大降水量有50%的可能性在109-191毫米之间,而降水量在100-250毫米之内被定级为大暴雨。实际观测值与预测值均为大暴雨,“韦森特”验证了李晴岚关于台风引发深圳地区降水定量预报的研究。
长期未能解决的难题为何有了转机?“最关键的是‘分类’,按照类别预估台风带来的影响。”李晴岚说,她根据台风登陆时的登陆地点、登陆距离、台风强度、登陆方位等关键特性进行划分,通过统计分析和数据挖掘的方法得出台风雨的影响程度。这是她乘坐公交车下班途中得到的灵感,经过几次与气象局专业人士的讨论尝试,半年内便有了初步的结果。
李晴岚先后在加拿大麦吉尔大学、香港大学取得了环境工程学硕士、博士学位。她从硕士开始就做数据分析、数学建模,在读博士期间研究过动力,对既注重动力也注重统计的气象研究有一定的帮助。
相比台风带来的降水预报,有关风的预报更为复杂。2014年4月,在此前一项研究的启发下,李晴岚开始着手台风对深圳地区大风影响的研究,半年内便有了初步的结果,当年9月“海鸥”登陆验证了她的研究。
“‘海鸥’中心距盐田港气象自动站的最近距离约有400公里,据以往经验,气象局认为此次台风影响不会很大,但预报员并不确定到底会引起多大的风。”按照李晴岚的预测,风力最大会达到27米/秒,时间在凌晨0时到2时之间,这与实际观测值29.1米/秒非常接近,最大风力发生时间为凌晨1时14分。
李晴岚的同事感叹道:“第二天上午气象局会商,大家都沸腾了,之前传统的气象手段还无法把距离在400公里左右的台风引起大风的时间及其强度预算得这么准。”
3 为盐田港作精细化预报,根据应用需求定课题
最近,李晴岚撰写的关于台风风雨定量预报的一篇研究论文将登上美国气象学会下的《Weather and Forecasting》杂志,这是气象预报领域的顶级期刊。
“我每周有三天都在深圳气市象局工作,与工作在一线的预报员天气会商,参加周报会,技术交流会,了解天气预报中的要点、难点;两天在深圳先进院,与同事沟通讨论、指导学生科研学习。”李晴岚告诉记者,比起理论研究,自己的研究工作更注重应用,一般是研究结果能直接应用于业务之后,才再撰写论文。
深圳盐田港是国际集装箱码头,风力条件对其码头日常货柜储运业务影响非常大,气象预报与经济利益的关联大。应对台风时如果停工过早,将造成较大损失,如果预警不及时,又可能有事故发生,因此精准的预报尤为必要。针对这种需求,李晴岚展开了重点防护单位定点精细化预报研究。
据盐田国际集装箱码头有限公司反馈给深圳先进院的信息,得益于深圳先进院研发的“近海台风引发区域性风雨预报”的技术模块——它能提前1-2天进行精细化的台风风雨影响预估,争取到更多灾害防御时间。空间精细到港区,可预估盐田港区域受台风影响的风雨特点、程度、持续时间。该模块启用后,3年来未出现因台风造成的港区人员伤亡,对盐田港业务经营和管理发挥了重要作用。
李晴岚说,气象部门掌握着丰富的第一手观测资料,他们急需把这些资料利用起来为气象预报服务。深圳先进院有着深厚的科研实力,也希望能发挥科研优势,与实际问题结合,为国计民生服务,因而才有了深圳先进院与深圳气象局的强强联合、深入合作。
据悉,深圳市气象局还通过深圳先进院与欧洲中期天气预报中心、美国俄克拉荷马大学风暴分析预报中心保持良好的合作。
记者了解到,李晴岚课题组将与深圳市气象局一起联合申报多模式集成预报系统项目,这个创意就产生自国际合作的过程中。多模式集成是指融合欧洲中心模式、日本模式、中国气象局Grapes模式,以及深圳气象局自主研发的实时同化预报系统模式的特点,发挥各自的长处,得出深圳乃至华南地区更精准的天气预报。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22