1.本发明涉及台风路径预测技术领域,具体是指一种预测台风路径的方法。
背景技术:
2.我国东临太平洋,正处于全球台风发生频率较高的西北太平洋海区附近,图1给出了1949 年至2018年cma记录每年太平洋热带气旋数量,每年都有热带气旋生成,生成次数几乎都在十次以上。据统计,在1998-2017年20年间登录我国的热带气旋占西北太平洋总生成热带气旋数量的31%。台风已成为影响我国的主要自然灾害之一,东部沿海地区又是我国政治经济文化较为发达的地区,长年受台风影响,每年登陆的台风对我国沿海地区造成巨大的人员伤亡和经济损失,如何对台风路径做出准确预测,进而提前预防,减少损失逐渐成为人们关注的重点。
3.国内外对台风路径预报做了许多研究,建立了一些台风路径的预报方法,主要有主观经验预报,客观统计预报,数值模式的动力预报,主观预报基本退出历史舞台,客观统计预报基于大量历史资料,寻找与预报对象有较强相关性的物理因子,使用概率统计方法,建立物理因子与预报对象间联系,找出相关规律,实施预报,数值模式的动力预报以大气动力学,热力学,流体力学为基础,利用相关原理描述大气运动,组成闭合的方程组,设定一定的初值和边界条件,利用计算机进行数值求解做出定量的预报,这些方法在实际应用的效果不错,但需要经验丰富或具备相关技能知识的人才能使用,很多应用场景中比较缺乏相应的条件,在人工智能技术出现后,人工智能技术被应用到诸多科学领域,气象领域就是其中之一,国内外都对人工智能技术应用到台风预报中做了大量研究,李某某,邓某某的研究指出如果选择有具体物理意义的前期因子,而且与后期出现的台风具有很好的相关性,用bp神经网络对标准数据进行训练,是可以建立台风预报模型的,周某某将天气数据进行抽象集中简化,用bp 神经网络对台风移动方向进行预测,由台风移动类别与实际出现的移动类别(西进,北上,西北移)概括率达97%,但是对疑难台风路路径的预报不是很准确,有待研究,黄某某等用 bp神经网络作为基本模型,通过对预报因子群进行特征提取和预报因子方差贡献技术相结合的方法进行气象预报因子数据的信息挖掘,模型研究结果显示,人工神经网络具有较强的自适应学习和非线性映射能力,很好的反应了台风路径的非线性特点,同时也指出异常路径会对预报造成困扰,邵某某,傅某某等依据bp神经网络对出现在中国沿海的热带气旋进行路径预测研究,使用预报前24小时的台风数据即可依据bp神经网络预报未来24小时,48小时,72 小时台风中心位置,并且精度满足要求,方某某,季某某等将人工智能技术和专家知识结合,建立专家系统,实现了台风的智能化自动预报,某研究者等将支持向量机方法同降维方法相结合,使之具有了识别非线性问题的能力,提高了台风路径预报的预测精度。
技术实现要素:
4.本发明要解决的技术问题是提供一种能够用cma热带气旋最佳路径数据集提供的
二维台风路径数据,建立lstm网络未来台风路径预报,用全序列预测的方式进行预测的一种预测台风路径的方法。
5.本发明所采用的技术方案为:一种预测台风路径的方法,其特征在于:包括初步实验,所述初步实验步骤如下:
6.首先建立4个模型,用4个不同时间步长的序列预测,模型一:全序列预测未来(4步) 24h路径;模型二:设置4步长滑动窗宽,预测未来24小时台风位置;模型三:四同模型2 使用滑动窗宽进行预测,模型3窗宽改为6,模型4窗宽改为8。
7.所述初步实验中每个模型隐藏层分别设置4,8,16个隐藏层节点,探求不同所设不同参数下台风预测效果并分析,然后根据实验结果优化模型。
8.所述初步实验的实验环境:
9.cpu为inter(r)i5-8300h,主频2.3ghz,ram为16gb,基于深度学习框架tensorflow,实验编程语言python3.7。
10.所述初步实验的数据来源:
11.cma热带气旋最佳路径数据集(tcdata.typhoon.org.cn),下载版本的cma热带气旋最佳路径数据集提供1949-2018年西北太平洋(含南中国海,赤道以北,东经180
°
以西)海域热带气旋每6小时的位置和强度。
12.所述初步实验的数据处理:
13.选取1949-2018年台风位置信息,数据为经纬度二维时间序列,处理成以热带气旋为单位的时间序列,共2355条台风位置序列,为降低较长序列的干扰,使模型更稳定,删去时间步长大于65的序列,因为要预测未来24h台风路径(4步),至少要求热带气旋路径长度要大于或等于8,所以删去时间步长小于8的序列,模型二滑动窗宽为4,热带气旋序列长度至少为8,建立模型二时删去时间步小于8的序列,同理,模型三删除序列长度小于10的序列,模型四删除序列长度小于12的序列,将1949-2017年数据作为训练集。2018年数据作为测试集,测试集共33条序列,为避免训练集带入测试集信息,划分后再分别对训练集,测试集各自做最z-score标准化处理,z-score标准化处理:
[0014][0015][0016][0017]
选取每个序列最后四个时间步位置作为标签(预测值),模型一用全序列预测,由于台风序列长度不一,模型一将各序列用0填充至相同长度;
[0018]
所述初步实验的神经网络设计:
[0019]
a.输入层:输入数据为2维经纬度台风位置数据,模型一添加屏蔽层,跳过填充为[0,0] 的时间步;
[0020]
b.隐藏层:一层隐藏层可以拟合任何包含从一个有限空间到另一个有限空间的连续映射的函数,初期实验尝试过多层隐藏层结构,与使用一层隐藏层的模型结果差异不大
或未能达到基本要求,初期的实验结果以及经验表明使用1层lstm层基本足够,考虑到层数较少只有一层,激活函数使用sigmoid和tanh函数;
[0021][0022]
igmoid函数将输入转化为[0,1]间的值,0表示全部舍弃,1表示全部保留,输出值很好的模拟了门的状态,在lstm网络中用以控制信息的流通;
[0023][0024]
tanh函数输出[-1,1]之间的值,能够对细胞状态进行过滤,为我们选择加入或减去细胞状态中的信息,tanh函数以0为中心,使得模型收敛速度更快;
[0025]
c.输出层:使用线性函数,直接输出结果,输出为(4,2)矩阵;
[0026]
d.其他超参数设置
[0027]
选择均方误差函数作为损失函数,均方误差:
[0028][0029]
损失函数用以判断模型结果同实际值的差距,训练集和验证集误差为模型的优化提供依据,当训练集和验证集损失都下降并趋于重合时,模型具有较好的效果,初期实验表明随着训练轮数增加,训练集和验证集损失逐渐下降并趋于稳定和重合,但过多的训练轮数会导致过拟合出现,训练集损失下降,但验证集损失不再下降甚至增大,模型的泛化能力下降,所以训练轮数定为150,所有偏置初始化为0,因为所选用激活函数为sigmoid和tanh,两个函数中间部分近似于线性函数,权重按xavier初始化方法进行初始化,减少激活函数输出偏向两端的情况,让激活值尽量分布广泛,使模型能够高效的学习,设置参数更新方法为adam,β1为0.9,β2为0.999,学习率设为0.0005,并将训练集中20%作为验证集,为避免过拟合,引入l2正则化项。
[0030]
本发明的有益效果:
[0031]
本发明用cma热带气旋最佳路径数据集提供的二维台风路径数据,建立lstm网络未来台风路径预报是可行的,用全序列预测的方式能进行较为粗浅的预测,由于台风路径长度不一,训练时会记住较久时间前的信息,预测精度不是很高,能够大概确定台风的移动方向,相对使用较小的滑动窗口预测的方法精度较低,滑动窗宽为4时能够进行较为准确的预测。预测多步时预测误差随时间呈现一个累积的效果,初始时间误差较小,随后误差增大,最后一步误差最大。预测的步长在1步时的预测效果比预测4步(24小时)误差小,预测精度随预测步长增加而降低。不同的台风类型预测效果不同,在台风路径中较为常见的路径预测效果较好,异常路径台风预测效果较差。使用动态规整算法选取与预测台风路径较为相似的台风作为测试集进行训练,模型的预测效果同实际路径差距不大,但同样常见台风路径比较稳定,能找到较为相似,数量较多的台风序列作为训练集,预测误差小,预测路径稳定无波折,异常路径经过动态规整算法选择的台风路径很难称之为相似路径,预测误差较大,整体来看,本发明从路径数据中挖掘隐藏信息进行预测,提高了大部分路径稳定的台风预测效果的预测精度。
附图说明
[0032]
图1为本发明一种预测台风路径的方法的cmabts1949-2018记录每年太平洋热带气旋数量变化图。
[0033]
图2为本发明一种预测台风路径的方法的普通神经网络图(左图)和rnn展开模块结构图(右图)。
[0034]
图3为本发明一种预测台风路径的方法的箱lstm展开结构图。
[0035]
图4为本发明一种预测台风路径的方法的lstm内部结构图。
[0036]
图5为本发明一种预测台风路径的方法的1949-2018年cmabst记录的热带气旋路径图 (左图)和热带气旋路径长度分布图(右图)。
[0037]
图6为本发明一种预测台风路径的方法的sigmoid函数图像。
[0038]
图7为本发明一种预测台风路径的方法的tanh函数图像。
[0039]
图8为本发明一种预测台风路径的方法的神经网络结构图。
[0040]
图9为本发明一种预测台风路径的方法的训练损失和测试损失图。
[0041]
图10为本发明一种预测台风路径的方法的模型二、三、四训练集和验证集损失随节点数变化图。
[0042]
图11为本发明一种预测台风路径的方法的模型二16隐藏节点测试集预测结果图。
[0043]
图12为本发明一种预测台风路径的方法的maliksi台风4个模型未来24小时预测图。
[0044]
图13为本发明一种预测台风路径的方法的usagi台风4个模型未来24小时预测图。
[0045]
图14为本发明一种预测台风路径的方法的cimaron台风模型预测4步误差图。
[0046]
图15为本发明一种预测台风路径的方法的cimaron台风4个模型未来24小时预测图。
[0047]
图16为本发明一种预测台风路径的方法的不同滑动窗宽训练集和验证集误差图。
[0048]
图17为本发明一种预测台风路径的方法的makiksl、romabia、cimaron、 mangkhut模型2、实验一、二4步测试误差图。
[0049]
图18为本发明一种预测台风路径的方法的maliksi台风对两条序列进行动态规整算法匹配累计距离矩阵(左图)及规整路径图(右图)。
[0050]
图19为本发明一种预测台风路径的方法的maliksi、mangkhot、rumbia台风通过动态规整算法匹配较为相似的台风序列图。
[0051]
图20为本发明一种预测台风路径的方法的使用动态规整算法调整训练集样本后模型预测结果图。
具体实施方式
[0052]
下面结合附图对本发明作进一步说明。
[0053]
为了一种预测台风路径的方法能够用cma热带气旋最佳路径数据集提供的二维台风路径数据,建立lstm网络未来台风路径预报,用全序列预测的方式进行预测,本发明提供一种如图所示的一种预测台风路径的方法,其功能在于:包括初步实验,所述初步实验步骤如下:
[0054]
首先建立4个模型,用4个不同时间步长的序列预测,模型一:全序列预测未来(4
步) 24h路径;模型二:设置4步长滑动窗宽,预测未来24小时台风位置;模型三:四同模型2 使用滑动窗宽进行预测,模型3窗宽改为6,模型4窗宽改为8。
[0055]
本发明中所述初步实验中每个模型隐藏层分别设置4,8,16个隐藏层节点,探求不同所设不同参数下台风预测效果并分析,然后根据实验结果优化模型。
[0056]
本发明中所述初步实验的实验环境:
[0057]
cpu为inter(r)i5-8300h,主频2.3ghz,ram为16gb,基于深度学习框架tensorflow,实验编程语言python3.7。
[0058]
本发明中所述初步实验的数据来源:
[0059]
cma热带气旋最佳路径数据集(tcdata.typhoon.org.cn),下载版本的cma热带气旋最佳路径数据集提供1949-2018年西北太平洋(含南海,赤道以北,东经180
°
以西)海域热带气旋每6小时的位置和强度,从图5中的1949-2018年cmabst记录的热带气旋路径图(左图) 可观察到,热带气旋路径大多从东南移向西北,在10
°
n-30
°
n之间偏向东北,可以预见这类在记录中较为常见的热带气旋会在之后的研究中模型的结果产生影响,图5中的热带气旋路径长度分布图(右图)显示了热带气旋的路径长度分布,从中可以看出热带气旋长度分布总体上类似正态分布,其中序列长度在8到65之间的序列占记录总数的96.8%以上。
[0060]
本发明中所述初步实验的数据处理:
[0061]
选取1949-2018年台风位置信息,数据为经纬度二维时间序列,处理成以热带气旋为单位的时间序列,共2355条台风位置序列,为降低较长序列的干扰,使模型更稳定,删去时间步长大于65的序列,因为要预测未来24h台风路径(4步),至少要求热带气旋路径长度要大于或等于8,所以删去时间步长小于8的序列,模型二滑动窗宽为4,热带气旋序列长度至少为8,建立模型二时删去时间步小于8的序列,同理,模型三删除序列长度小于10的序列,模型四删除序列长度小于12的序列,将1949-2017年数据作为训练集。2018年数据作为测试集,测试集共33条序列,为避免训练集带入测试集信息,划分后再分别对训练集,测试集各自做最z-score标准化处理,z-score标准化处理:
[0062][0063][0064][0065]
选取每个序列最后四个时间步位置作为标签(预测值),模型一用全序列预测,由于台风序列长度不一,模型一将各序列用0填充至相同长度;
[0066]
本发明中所述初步实验的神经网络设计:
[0067]
a.输入层:输入数据为2维经纬度台风位置数据,模型一添加屏蔽层,跳过填充为[0,0] 的时间步;
[0068]
b.隐藏层:一层隐藏层可以拟合任何包含从一个有限空间到另一个有限空间的连续映射的函数,初期实验尝试过多层隐藏层结构,与使用一层隐藏层的模型结果差异不大或未能达到基本要求,初期的实验结果以及经验表明使用1层lstm层基本足够,考虑到层数
较少只有一层,激活函数使用sigmoid和tanh函数;
[0069][0070]
igmoid函数将输入转化为[0,1]间的值,0表示全部舍弃,1表示全部保留,输出值很好的模拟了门的状态,在lstm网络中用以控制信息的流通;
[0071][0072]
tanh函数输出[-1,1]之间的值,能够对细胞状态进行过滤,为我们选择加入或减去细胞状态中的信息,tanh函数以0为中心,使得模型收敛速度更快;
[0073]
c.输出层:使用线性函数,直接输出结果,输出为(4,2)矩阵;
[0074]
d.其他超参数设置
[0075]
选择均方误差函数作为损失函数,均方误差:
[0076][0077]
损失函数用以判断模型结果同实际值的差距,训练集和验证集误差为模型的优化提供依据,当训练集和验证集损失都下降并趋于重合时,模型具有较好的效果,初期实验表明随着训练轮数增加,训练集和验证集损失逐渐下降并趋于稳定和重合,但过多的训练轮数会导致过拟合出现,训练集损失下降,但验证集损失不再下降甚至增大,模型的泛化能力下降,所以训练轮数定为150,所有偏置初始化为0,因为所选用激活函数为sigmoid和tanh,两个函数中间部分近似于线性函数,权重按xavier初始化方法进行初始化,减少激活函数输出偏向两端的情况,让激活值尽量分布广泛,使模型能够高效的学习,设置参数更新方法为adam,β1为0.9,β2为0.999,学习率设为0.0005,并将训练集中20%作为验证集,为避免过拟合,引入l2正则化项。
[0078]
初期实验结果为模型的设置,参数调整等做初步的探讨,为实验设计框架做基础准备,所以不列入实验结果。
[0079][0080]
表一:4个模型不同隐藏节点训练损失和验证损失(左为训练集损失,右为验证集损失)
[0081]
从模型来看,模型一用全序列预测未来24小时台风路径,其训练集损失和验证集损失都为四个模型中最大的。其余三个训练集损失和测试集损失保持较低的水平,训练集损失在0.01 左右,测试集损失在0.005左右。
[0082]
从节点数来看,4个模型隐藏节点数为4时训练集损失最大,隐藏节点数为16时损失最小。图10只列出的模型二,三,四的训练集和验证集损失,模型一同以上3个模型,当隐藏节点数从4增大到16时训练集和验证集损失都减小。
[0083]
用不同隐藏节点的四个模型对测试数据进行预测,我们仍用mse作为预测结果批判标准,从预测的效果看,如图11所示,不同类型路径的台风的预测效果不一,大致可以分为两类台风。一类是以bolave,maliksi,jelawat,mangkhout等为代表的台风,台风路径比较稳定,转折较少,预测区间内的实际路径较预测前转向幅度不大。这类台风的预测路径比较接近实际路径,预测台风移动方向同实际台风移动方向大致相同或者两者角度较小。而且这类台风在不同模型中预测效果变化较小,表现稳定(图11只给出了模型二在隐藏节点数为16时的预测结果,其他模型结果与模型二类似)。例如maliksi台风在四个模型中预测结果都与实际路径基本重合。以隐藏节点数为16为例,maliksi台风四个模型的经纬度误差较小,从图12 中可看到四个模型对maliksi台风的预测效果基本稳定,预测路径同实际路径能够重合或部分重合,预测的台风移动与实际方向一致。
[0084]
表二:台风maliksi test loss
[0085][0086]
第二类以sanba,ewiniar,wukong,usagi等为代表,这些台风相对第一类台风路径转折较多,路径诡异,实际路径在预测前后方向转向较大。这类台风的预测路径和实际路径差距较大,预测效果不是十分理想,而且在不同模型中预测效果变化明显。例如usagi台风,以隐藏节点数为16为例,如图13所示,该台风在模型一中预测效果表现较差,预测路径与实际路径几乎垂直,方向完全不一致。模型二,模型三预测路径与实际路径开始几步时基本重合,随后几步预测路径逐渐偏离实际路径。模型四预测路径大致和实际路径平行,预测移动方向同实际方向一致。
[0087]
表三:usagi test loss
[0088][0089]
从总体的预测结果看,大多数台风第一步的预测结果较为接近实际位置,往后便出现偏移,误差呈现随时间累积的趋势,预测结果到第四步时偏移最大。从图12maliksi台风和图 13usagi台风的预测结果中能够大概看出类似趋势。这里再以cimaron台风为例,隐藏节点为16的4个模型对cimaron台风的预测误差第1步到第4步的损失逐渐增大,预测精度下降 (图14),预测的位置同实际位置偏移逐渐变大(图15)。
[0090]
表四:cimaron台风模型预测4步误差
[0091]
[0092]
综上,一层隐藏层的lstm神经网络能够使用历史台风路径进行未来台风路径预测。使用不同步长的历史台风数据预测会对预测误差产生影响,4时间步滑动窗口的预测误差比全序列作为输入的预测误差较小。不同台风的预测效果也不同,路径较为顺滑,波动较小的台风预测误差比路径曲折,不稳定的台风预测误差较小。另外,预测误差呈现随时间累计的趋势,往往第一步误差较小,随后误差逐渐增大,预测路径偏离实际路径。
[0093]
接下来,对模型进行优化:
[0094]
(一)更改滑动窗宽
[0095]
针对模型一和其余三个模型的差别,设置隐藏节点数为16,新增滑动窗口为12,16,20,其他参数不变的模型5,6,7进行进一步探讨。
[0096]
表五:不同滑动窗宽训练集和验证集误差
[0097][0098]
由图16可知,随着滑动窗口的增长,模型的训练集和测试集误差同时增加。较短的窗口基本满足预测要求,过长的时间序列可能记忆较久时间前无用信息,造成误差增大。模型应设置较小的滑动窗宽,只使用预测前4步(24小时)左右的台风路径能够得到未来24小时台风路径误差较小的预测结果。
[0099]
(二)更改预测时间步长
[0100]
预测结果随时间越往后误差越大,我们选用模型二,设置隐藏节点数为16,改为只预测未来一个时间步(6小时后)的台风位置,选择台风makiksl,rombia,cimaron,mangkhut 设置两个改进实验进一步探究。原实验二只预测一次,共预测四步,改进实验一在预测一步后将预测结果加入输入序列,再滑动预测下一步,共预测四次,改进实验二只滑动预测四次,预测结果不再并入输入序列。从结果看,makiksl,rombia和namgkhut台风的对改进实验一的适用性较差,改用实验一后这三个台风的预测误差较模型二的预测误差进一步加大,没有出现预期的优化效果,误差逐步累计,到第四步时达到最大。改进实验二中,四个台风的四个时间步的误差均处于较低水平,比模型二测试误差随时间累积增大的情况不明显,且误差比模型二,改进实验一低。总体上,预测时间步减小,台风的测试误差下降,预测时间步为 1步(6h)时较预测4步(24h)效果较好。
[0101]
(三)动态规整算法
[0102]
台风的序列长度不同,而且形状不同,这给训练带来很大的困难,训练中会将相较异常的台风路径信息也学习到模型中。如果能够从历史数据中筛选出与预测台风路径较为相似的台风路径进行训练,则能够学习到较为精确的信息,那么误差将进一步下降。结合此前结果,我们使用动态规整算法,进一步优化模型。动态规整算法是曲线相似匹配的一种算法,它能给出两条序列的最小距离或相似度,从而判定两条序列的相似情况。动态规整算法实际上计算的是欧式距离,该算法找到两个序列中正确对应的点,一个序列的一个点可能对应另一个序列的多个点,当两个序列各个点正确对应时,计算所有对应点的距离之和,这个距离为最小值,且为两个序列的距离。
[0103]
动态规整算法实现
[0104]
设有两个时间序列p=(p1,p2,p3...pn),t=(t1,t2,t3...tm)。
[0105]
在本文语境中p序列为测试集某一台风路径序列,t序列为训练集中用以匹配的台风路径序列。pi=(x
p
,y
p
),tj=(x
t
,y
t
)。
[0106]
建立序列p,t的距离矩阵d,距离矩阵d为(m
×
n)矩阵
[0107]di,j
=(x
pi-x
tj
)2+(y
pi-y
tj
)2ꢀꢀꢀꢀ
(1≤i≤m,1≤j≤n)
[0108]
建立累积距离矩阵a,将序列p,t序列首端对齐开始匹配,每到一个点,之前所有点的距离都会累加。
[0109]a1,1
=0
[0110]ai,1
=d
i,1
+a
i-1,1
(2≤i≤m)
[0111]a1,j
=d
1,j
+a
1,j-1
(2≤j≤n)
[0112]ai,j
=d
i,j,j-1
+min(a
i,j-1
,a
i-1,j
,a
i-1,j-1
)(2≤i≤m,2≤j≤n)
[0113]
在累积距离矩阵中,我们能找到一条路径,路径上的点即为正确对应的点,a
m,n
即为两条序列的距离或相似度。
[0114]
图18中左边的图中所示是maliksi台风同barijat台风动态规整算法匹配结果,图 18中右边的图中所示的是maliksi台风同经过匹配后与其较为相似的台风的匹配结果。其中路径经过的点即为两条序列正确对应的点,如路径经过[0,0]则序列1第一个点和序列2的第一个点正确对应。从图18中综合可以看到,如果两个序列相似度较大,路径穿过的点为累积矩阵中较小值的点,如果两条序列差别较大,规整路径经过的点有较大值,使得两条序列总体上距离偏大,显然图18中右边的图中所匹配的台风路径较图18中左边的图中所匹配的台风更相似于maliksi。我们使用动态规整算法,将预测序列同原训练集所有台风进行匹配,选择训练集中相似度在前1/3的台风路径序列,作为新的训练集进行训练。设置模型隐藏节点数为16,滑动窗口为4,其他参数不变,只预测一步(6h后位置)。用maliksi,mangkhot, rumbia,三个台风进行进一步探究。图19显示了经过动态规整算法匹配后与上述四个台风较相似的4个台风路径,最左为原始台风路径,其右四图为与其相似的台风路径。
[0115][0116][0117]
如图20所示,我们使用4个时间步滑动预测整个序列,四个台风的预测路径基本与实际路径重合。我们使用与预测台风相似度大的台风路径作为训练集,这里的相似度基于两条路径动态规整匹配所得的最小距离,不同于日常中的相似。所以通过匹配后可以从图19中看出,如maliksi这类台风,在总数据集中能找到大量与其相似的台风,但是如mangkhut这类路径比较异常的台风,很难从总数据集中找到与其相似的台风路径,使用动态规整算法只能找到与其距离较小的台风路径,但几乎不完全相似于mangkhut台风路径形状,从预测的结果中(图20)看到,maliksi台风的预测路径几乎没有波折,预测路径与实际路径基本重合。mangkhut台风的预测路径波折较多。另外,通过动态规整算法选择后训练数据减少,这也会对预测结果产生影响。异常路径的台风预报一直是预报的困扰,本次研究中也发现了这种情况,一种情况是这类台风在历史数据中较少,从图5中的1949-2018年cmabst 记录的热带气旋路径图(左图)可以看出相似于maliksi台风路径的热带气旋较多,这类台风的预测效果较好,其他研究指出可以用增加台风数据库中异常路径的数量等方法
提高异常路径台风的预测准度,这里不再做详细探讨。
[0118]
用cma热带气旋最佳路径数据集提供的二维台风路径数据,建立lstm网络未来台风路径预报是可行的,用全序列预测的方式能进行较为粗浅的预测,由于台风路径长度不一,训练时会记住较久时间前的信息,预测精度不是很高,能够大概确定台风的移动方向,相对使用较小的滑动窗口预测的方法精度较低,滑动窗宽为4时能够进行较为准确的预测。预测多步时预测误差随时间呈现一个累积的效果,初始时间误差较小,随后误差增大,最后一步误差最大。预测的步长在1步时的预测效果比预测4步(24小时)误差小,预测精度随预测步长增加而降低。不同的台风类型预测效果不同,在台风路径中较为常见的路径预测效果较好,异常路径台风预测效果较差。使用动态规整算法选取与预测台风路径较为相似的台风作为测试集进行训练,模型的预测效果同实际路径差距不大,但同样常见台风路径比较稳定,能找到较为相似,数量较多的台风序列作为训练集,预测误差小,预测路径稳定无波折,异常路径经过动态规整算法选择的台风路径很难称之为相似路径,预测误差较大。
[0119]
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
技术特征:
1.一种预测台风路径的方法,其特征在于:包括初步实验,所述初步实验步骤如下:首先建立4个模型,用4个不同时间步长的序列预测,模型一:全序列预测未来(4步)24h路径;模型二:设置4步长滑动窗宽,预测未来24小时台风位置;模型三:四同模型2使用滑动窗宽进行预测,模型3窗宽改为6,模型4窗宽改为8。2.根据权利要求1所述的一种预测台风路径的方法,其特征在于:所述初步实验中每个模型隐藏层分别设置4,8,16个隐藏层节点,探求不同所设不同参数下台风预测效果并分析,然后根据实验结果优化模型。3.根据权利要求1所述的一种预测台风路径的方法,其特征在于:所述初步实验的实验环境:cpu为inter(r)i5-8300h,主频2.3ghz,ram为16gb,基于深度学习框架tensorflow,实验编程语言python3.7。4.根据权利要求1所述的一种预测台风路径的方法,其特征在于:所述初步实验的数据来源:cma热带气旋最佳路径数据集(tcdata.typhoon.org.cn),下载版本的cma热带气旋最佳路径数据集提供1949-2018年西北太平洋(含南海,赤道以北,东经180
°
以西)海域热带气旋每6小时的位置和强度。5.根据权利要求1所述的一种预测台风路径的方法,其特征在于:所述初步实验的数据处理:选取1949-2018年台风位置信息,数据为经纬度二维时间序列,处理成以热带气旋为单位的时间序列,共2355条台风位置序列,为降低较长序列的干扰,使模型更稳定,删去时间步长大于65的序列,因为要预测未来24h台风路径(4步),至少要求热带气旋路径长度要大于或等于8,所以删去时间步长小于8的序列,模型二滑动窗宽为4,热带气旋序列长度至少为8,建立模型二时删去时间步小于8的序列,同理,模型三删除序列长度小于10的序列,模型四删除序列长度小于12的序列,将1949-2017年数据作为训练集。2018年数据作为测试集,测试集共33条序列,为避免训练集带入测试集信息,划分后再分别对训练集,测试集各自做最z-score标准化处理,z-score标准化处理:score标准化处理:score标准化处理:选取每个序列最后四个时间步位置作为标签(预测值),模型一用全序列预测,由于台风序列长度不一,模型一将各序列用0填充至相同长度。6.根据权利要求1所述的一种预测台风路径的方法,其特征在于:所述初步实验的神经网络设计:a.输入层:输入数据为2维经纬度台风位置数据,模型一添加屏蔽层,跳过填充为[0,0]的时间步;
b.隐藏层:一层隐藏层可以拟合任何包含从一个有限空间到另一个有限空间的连续映射的函数,初期实验尝试过多层隐藏层结构,与使用一层隐藏层的模型结果差异不大或未能达到基本要求,初期的实验结果以及经验表明使用1层lstm层基本足够,考虑到层数较少只有一层,激活函数使用sigmoid和tanh函数;igmoid函数将输入转化为[0,1]间的值,0表示全部舍弃,1表示全部保留,输出值很好的模拟了门的状态,在lstm网络中用以控制信息的流通;tanh函数输出[-1,1]之间的值,能够对细胞状态进行过滤,为我们选择加入或减去细胞状态中的信息,tanh函数以0为中心,使得模型收敛速度更快;c.输出层:使用线性函数,直接输出结果,输出为(4,2)矩阵;d.其他超参数设置选择均方误差函数作为损失函数,均方误差:损失函数用以判断模型结果同实际值的差距,训练集和验证集误差为模型的优化提供依据,当训练集和验证集损失都下降并趋于重合时,模型具有较好的效果,初期实验表明随着训练轮数增加,训练集和验证集损失逐渐下降并趋于稳定和重合,但过多的训练轮数会导致过拟合出现,训练集损失下降,但验证集损失不再下降甚至增大,模型的泛化能力下降,所以训练轮数定为150,所有偏置初始化为0,因为所选用激活函数为sigmoid和tanh,两个函数中间部分近似于线性函数,权重按xavier初始化方法进行初始化,减少激活函数输出偏向两端的情况,让激活值尽量分布广泛,使模型能够高效的学习,设置参数更新方法为adam,β1为0.9,β2为0.999,学习率设为0.0005,并将训练集中20%作为验证集,为避免过拟合,引入l2正则化项。
技术总结
本发明涉及台风路径预测技术领域,具体是指一种预测台风路径的方法。包括初步实验,所述初步实验步骤如下:首先建立4个模型,用4个不同时间步长的序列预测,模型一:全序列预测未来(4步)24h路径;模型二:设置4步长滑动窗宽,预测未来24小时台风位置;模型三:四同模型2使用滑动窗宽进行预测,模型3窗宽改为6,模型4窗宽改为8。本发明提供一种能够用CMA热带气旋最佳路径数据集提供的二维台风路径数据,建立LSTM网络未来台风路径预报,用全序列预测的方式进行预测的一种预测台风路径的方法。方式进行预测的一种预测台风路径的方法。
技术研发人员:陶辉 陈金雨
受保护的技术使用者:中国科学院新疆生态与地理研究所
技术研发日:2021.08.17
技术公布日:2022/3/8