京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 看天更靠谱
大数据时代,气象服务在不断地拓宽领域,从最基础的天气预报到现有的气候预测、气候可行性论证、公共气象服务、专业专项气象服务、气象防灾减灾,为社会创造财富、减轻损失;同时,大数据技术是气象服务不断创新和完善的重要支撑。
1 事实验证数据分析,“妮坦”的红色预警发对了
每个城市都有各行各业的大数据,深圳市在推进大数据发展方面已经具备一定基础,共享基础数据库建设等方面处于国内领先水平,在市场监管、交通运输、税务部门等部门的应用取得了积极成效。
在气象大数据方面,深圳市气象局与深圳先进院已合作多年。2009年,深圳市气象局与先进院高性能计算中心开始交流合作,2012年初,深圳市气象局提出预报“回南天”的研究方向,随后又提出台风精准预报、灰霾预报等新课题。
5年前,先后在加拿大麦吉尔大学、香港大学学习的李晴岚加入深圳先进院,被委派至深圳市气象局担任相关项目负责人。通过与深圳市气象局等部门合作,深圳先进院气象预报团队在台风风雨预报领域取得了显著的成果,大幅度提高了台风预报的时间、空间精度。基于这些数据,气象部门能够做出及时准确的预报预警,政府部门能够有效地组织人员疏散,最大限度地保障人民生命和财产安全。
以8月的“妮妲”为例,根据深圳先进院与市气象局合作的“近海台风引发深圳地区的风雨研究”的结论,“妮坦”台风从东南方向接近珠三角地区,距离深圳200公里左右时将引发深圳大风,全市大风起风时间在22时至24时左右,并推测深圳最大阵风将达到12-13级。
李晴岚告诉记者:“根据大数据分析结果,严格来说盐田港的最大阵风应该在27-33米/秒范围。盐田港风力一般受台风影响大,但在深圳市不一定是最大的,为安全起见,考虑深圳可能的最大阵风报12到13级比较合适,与实际观测值深圳地区在‘妮妲’影响期间的最大阵风为37米/秒高度吻合(13级风的范围在37-41.4米/秒之间)”。
市气象局依据此科研结果,综合气象预报员的专业分析,在第一时间果断对市民发出了台风红色预警,这也是深圳市气象台历史上首次发布台风红色预警。
“每一次台风到来,产生的新观测数据都会纳入数据库。”李晴岚表示,对每一种进入700公里影响范围的不同类型台风,如果数据库只有2个样本供参考,预报正确的概率是33%,如果历史上有18个类似样本供参考,预报正确的概率可以大幅提升到89%。随着样本数的增加,预报置信度就会越高。
2 从“韦森特”到“海鸥”,准确预测降水、风力
李晴岚表示,相比较为容易预测的台风路径,台风强度预报和台风风雨定量预报是世界性的预测难题。
2011年,刚从香港来深圳不久的李晴岚了解到市气象局一直在做风雨定量预报方面的研究,但一直困难重重未能出结果。大约半年后,她和团队部分解决了这个难题。
2012年7月24日,台风“韦森特”在深圳登陆,最大日降水量达到152.5毫米。在“韦森特”登陆前,李晴岚已经有了初步的研究结果,认为“韦森特”带来的日最大降水量有50%的可能性在109-191毫米之间,而降水量在100-250毫米之内被定级为大暴雨。实际观测值与预测值均为大暴雨,“韦森特”验证了李晴岚关于台风引发深圳地区降水定量预报的研究。
长期未能解决的难题为何有了转机?“最关键的是‘分类’,按照类别预估台风带来的影响。”李晴岚说,她根据台风登陆时的登陆地点、登陆距离、台风强度、登陆方位等关键特性进行划分,通过统计分析和数据挖掘的方法得出台风雨的影响程度。这是她乘坐公交车下班途中得到的灵感,经过几次与气象局专业人士的讨论尝试,半年内便有了初步的结果。
李晴岚先后在加拿大麦吉尔大学、香港大学取得了环境工程学硕士、博士学位。她从硕士开始就做数据分析、数学建模,在读博士期间研究过动力,对既注重动力也注重统计的气象研究有一定的帮助。
相比台风带来的降水预报,有关风的预报更为复杂。2014年4月,在此前一项研究的启发下,李晴岚开始着手台风对深圳地区大风影响的研究,半年内便有了初步的结果,当年9月“海鸥”登陆验证了她的研究。
“‘海鸥’中心距盐田港气象自动站的最近距离约有400公里,据以往经验,气象局认为此次台风影响不会很大,但预报员并不确定到底会引起多大的风。”按照李晴岚的预测,风力最大会达到27米/秒,时间在凌晨0时到2时之间,这与实际观测值29.1米/秒非常接近,最大风力发生时间为凌晨1时14分。
李晴岚的同事感叹道:“第二天上午气象局会商,大家都沸腾了,之前传统的气象手段还无法把距离在400公里左右的台风引起大风的时间及其强度预算得这么准。”
3 为盐田港作精细化预报,根据应用需求定课题
最近,李晴岚撰写的关于台风风雨定量预报的一篇研究论文将登上美国气象学会下的《Weather and Forecasting》杂志,这是气象预报领域的顶级期刊。
“我每周有三天都在深圳气市象局工作,与工作在一线的预报员天气会商,参加周报会,技术交流会,了解天气预报中的要点、难点;两天在深圳先进院,与同事沟通讨论、指导学生科研学习。”李晴岚告诉记者,比起理论研究,自己的研究工作更注重应用,一般是研究结果能直接应用于业务之后,才再撰写论文。
深圳盐田港是国际集装箱码头,风力条件对其码头日常货柜储运业务影响非常大,气象预报与经济利益的关联大。应对台风时如果停工过早,将造成较大损失,如果预警不及时,又可能有事故发生,因此精准的预报尤为必要。针对这种需求,李晴岚展开了重点防护单位定点精细化预报研究。
据盐田国际集装箱码头有限公司反馈给深圳先进院的信息,得益于深圳先进院研发的“近海台风引发区域性风雨预报”的技术模块——它能提前1-2天进行精细化的台风风雨影响预估,争取到更多灾害防御时间。空间精细到港区,可预估盐田港区域受台风影响的风雨特点、程度、持续时间。该模块启用后,3年来未出现因台风造成的港区人员伤亡,对盐田港业务经营和管理发挥了重要作用。
李晴岚说,气象部门掌握着丰富的第一手观测资料,他们急需把这些资料利用起来为气象预报服务。深圳先进院有着深厚的科研实力,也希望能发挥科研优势,与实际问题结合,为国计民生服务,因而才有了深圳先进院与深圳气象局的强强联合、深入合作。
据悉,深圳市气象局还通过深圳先进院与欧洲中期天气预报中心、美国俄克拉荷马大学风暴分析预报中心保持良好的合作。
记者了解到,李晴岚课题组将与深圳市气象局一起联合申报多模式集成预报系统项目,这个创意就产生自国际合作的过程中。多模式集成是指融合欧洲中心模式、日本模式、中国气象局Grapes模式,以及深圳气象局自主研发的实时同化预报系统模式的特点,发挥各自的长处,得出深圳乃至华南地区更精准的天气预报。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10