-
0 引言
-
近年来,计算机技术的发展推动数值天气预报的进步,但是复杂的模型和高计算耗能逐渐成为数值预报性能提升的瓶颈,如基于深度学习方法进行天气预报的技术开始被研究人员关注。此外,考虑到气象领域近几十年来积累了大量的观测数据、卫星图像、数值模型数据和再分析数据等,对于气象预报这样的复杂非线性处理场景,适合人工智能 (AI)技术发挥作用。习近平总书记指出,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革基于的战略问题。在海洋预报领域,人工智能大模型的发展和应用正逐渐成为研究热点与关键课题。
-
海洋建模将海洋学带入可实验性和可预测性的时代。利用数值算法求解控制方程,海洋建模使研究人员能够模拟和预测海洋动力学,并促进海洋的定性和定量研究[1]。随着高性能计算集群的发展,更复杂的数值算法、参数化方案和数据同化方法已被部署在海洋建模和海洋预报系统中,逐渐达到精确的全球海洋模拟[2]。传统的海洋数值模拟揭示了一个经验知识,即准确的模拟意味着更高的计算成本,据估计,其存储容量和计算速度是当前硬件性能的 100 亿倍[3]。
-
丰富而高质量的数据推动了深度学习模型的蓬勃发展,深度学习模型已成为世界上讨论最多的话题之一。包括大型语言模型在内的生成型人工智能模型已经开始对人们的日常生活产生深远影响。在地球科学领域,基于人工智能的建模已经取得了逐步的成果,甚至正在逐步部署到运营机构中,并有对应的研究成果[4-6]。对于中期天气预报,基于人工智能的建模[7]已经证明,具有大参数的深度学习模型可以在 10 天预报之外与数值预报系统进行比较[8-9]。这些研究证明,大型深度学习模型在学习和建模地球系统动力学方面具有巨大潜力。
-
1 海洋环境预报研究进展
-
海洋环境预报重要性不言而喻,当前海洋环境预报主要分为机理驱动的数值模式预报、模型驱动的统计模式预报以及数据驱动的大数据模式智能预报 3 种。
-
1.1 数值模式预报
-
数值模式预报是早期主要使用的预报模式,从 1969 年诞生,并由科研人员不断发展完善,针对不同海域和海洋学科,目前已有超过 40 个海洋数值模式。
-
数值模拟是一种广泛使用的技术,通过基于海洋物理定律方程的数据模拟来解决复杂的海洋问题。目前,普林斯顿海洋模型(Princeton Ocean Model,POM)[10]、混合坐标海洋模型(Hybrid Coordinate Ocean Model,HYCOM)[11]和非结构网格有限体积海岸海洋模型(Finite Volume Coast and Ocean Model,FVCOM)[12]在海洋学中得到了广泛应用。
-
普林斯顿海洋模型是一种经典的传统海洋模型,结构清晰,模型规范简洁,模型物理解释透彻; 混合坐标海洋模型灵活的垂直层次结构使其更适合分层效应的显著扩展;FVCOM 模型包括动量方程、连续性方程、热盐守恒方程和状态方程;非结构网格有限体积海岸海洋模型的数值解采用有限体积法,基于非结构化网格,具有计算准确、快速、海岸线边界和海底地形拟合良好的优点。这是因为其可以更好地保证每个物理量不仅在每个单元中,而且在整个计算区域中守恒。
-
所有这些数值模型都是基于对海洋物理学的了解构建的,它们通常用于模拟海洋动力学和预测海洋地下温度。然而,由于存在大量影响海洋环境的环境因素,因此很难保证它们的预测准确性。
-
为了提高数值模型的预测精度,通常使用同化方法。传统的同化方法可以通过在数值模型的动态运行过程中融合新的观测数据来提高模型预测性能。
-
SMEDSTAD[13]总结了 1991 年之前开发的数据同化方法,并将其分为多项式插值方法、最优插值方法和变分分析方法。ANDERSON 等人[14]还调查了物理海洋学中的数据同化方法。虽然传统同化方法的预测精度远高于数值模型,但这些方法还有很大的改进空间。
-
我国目前建立的数值预报模式对三维海洋、混合层海温等进行预报,但由于本身机理机制,仍受限于国外且面临精度提高困难的问题。在数值预报模式框架之外探索提高预报技巧的方法和技术,对提升海洋环境预报能力意义重大。
-
1.2 模型驱动的统计模式预报
-
与基于物理的数值模型相比,模型驱动的统计模式预报依赖观测数据来学习底层数据分布,最开始是一种数值预报模式的补充手段,随着计算机技术的发展,也取得了一定的突破。
-
统计预报模式由于不需要进行物理条件的预设,只需要保证海洋数据之间存在相关性即可,因此统计预报模式在模型驱动下可以突破数值模式中时效的限制[15]。当前海洋环境预报研究中,有差分整合移动平均自回归模型[16]、支持向量回归模型[17]等统计模型用于统计模式预报。
-
差分整合移动平均自回归模型主要用于预测海洋要素的时间序列,优点是方法简单,只依靠数据本身;缺点是对时序数据的平稳性有较高要求。 CHEN 等从统计模型的角度研究了一种新的组合模型,基于线性组合权重计算的灰度模型–差分整合移动平均自回归模型,通过对比实验分析了预测效果,并使用了多个绩效评价指标,以证明提出的组合模型的科学性和有效性。最后,根据实验结果,可以清楚地发现,在计算线性组合权重的 4 种方法中,即等权法、方差互易法、残差互易法和标准差法,使用标准差法计算的组合模型具有最高的预测精度,因此最终决定使用这种方法构建组合模型 (即灰度模型–差分整合移动平均自回归模型)。此外,与其它现有的预测模型相比,灰度模型–差分整合移动平均自回归模型在预测时具有相对较高的预测精度,可用于更有效、更准确地预测全球平均温度[18]。
-
支持向量回归模型通过求取最优超平面,达到样本中数据点到该超平面距离最小的目的,其优点是可以在针对高维度海洋数据空间时避免复杂性,缺点则是在处理时需要模型进行前期参数调节,提高了样本空间消耗。MALIK 等对支持向量回归模型通过 6 种元启发式算法进行了优化,即蚂蚁狮优化、多对优化器、斑点鬣狗优化、哈里斯–霍克斯优化、粒子群优化和贝叶斯优化,以预测印度北阿坎德邦诺拉流域的日流量。在处理之前,通过 Gamma 检验提取混合 SVR 模型的重要输入和参数组合。在校准(训练)和验证(测试)期间,通过混合支持向量回归模型获得的结果,使用均方根误差、散点指数、相关系数、Willmott 指数等性能指标以及目视检查(时间序列图、散点图和泰勒图) 与观测到的流量进行比较。比较结果表明,在校准/ 验证期间,哈里斯–霍克斯优化后的支持向量回归在预测研究流域的日流量方面优于蚂蚁狮优化、多对优化器、斑点鬣狗优化、粒子群优化和贝叶斯优化。此外,新的哈里斯–霍克斯优化后的支持向量归回模型算法在预测精度方面优于其他元启发式算法[19]。
-
然而,目前尚不清楚这些模型是如何产生具体决策的,从物理上解释这些数据驱动的模型非常困难。由于这些方法只依赖于训练数据,它们对看不见的数据的泛化能力往往有限,而大多数基于物理的模型不利用训练数据,因此,只要用于构建这些模型的物理定律能够准确地表示底层数据分布,即使数据可见性较低,模型仍然可以具备良好的分析能力。然而,物理规则往往不完整,这些数值模型需要改进和补充。除此之外,预报时长较短以及数据空间降维时造成信息丢失也是需要考虑的问题。
-
1.3 数据驱动的大数据模式智能预报
-
在海洋环境预报领域,基于数据驱动的数据模式预报方法,也体现了李国杰院士对重视数据科学研究、体现密集型范式理论的观点。其利用模式识别深度学习等分析方法,寻找数据分析与预报的多要素间的联系,构建数据预报模型,实现海洋环境要素的预测。
-
近年来,计算机视觉和自然语言处理中的深度学习取得了突破性进展。其潜在动机是模拟人脑神经连接结构。在处理高维数据时,通过多层逐步提取高级特征,以识别与人类相关的概念。深度学习模型大致可分为 2 类:判别模型和生成模型。一方面训练判别模型以在可能的输出选择中区分正确的输出。另一方面,对生成模型进行训练,以更好地理解数据样本。具体来说,生成模型从输入样本中学习分布,然后基于该分布生成类似的样本以增强模型。
-
图1 智能预报与大模型示意图
-
Fig.1 Schematic diagram of intelligent forecasting and big model
-
然而,在地球系统科学中,它在基于人工智能的建模方面仍有 2 个差距。首先,海洋作为地球系统最重要的组成部分之一,目前尚未建立大型深度学习模型。与大气模拟不同,海洋是一个特殊的系统,具有封闭的复杂地球测量边界,这意味着应该考虑地形拓扑约束[2];另外,海洋观测显示出稀疏性和不平衡分布,甚至在深海中也有大量观测缺失[20]。
-
目前,领先的全球海洋预报系统(如墨卡托海洋物理系统和实时海洋预报系统)使用流体力学和热力学中的物理驱动模型,根据当前的海洋条件预测未来的海洋运动状态和现象[21]。一些数据驱动的人工智能模型在大气天气预报中显示出了潜力,如盘古天气[22]和 Graph Cast[23]。与目前领先的数值天气预报方法相比,它们在全球中期天气预报中取得了相当甚至更好的预测结果[24-25]。
-
数据驱动模型的一个显著优势是,它们可以使预测速度比数值天气预报方法快数千甚至数万倍[12]。此外,它们可以从海量气象数据中自动学习时空关系,并有效地捕捉天气变化的规律,而无需引入物理机制的先验知识。
-
在进行海洋环境大数据预报中,研究人员重点使用了循环神经网络(Recurrent Neural Network, RNN)与卷积神经网络( Convolutional Neural Networks,CNN)等深度学习模型,其中,RNN 由于考虑了前一时刻的输入数据,同时赋予了神经网络对前面内容的一种“记忆”功能,因此其网络会对之前的信息产生记忆并表现在此刻输出中,即隐藏层之间节点产生连接,可跟踪海洋环境时间序列之间的动态时间依赖行为成为。同样,对此前数据的使用导致在相隔较远时 RNN 出现长期以来的问题,研究人员也对此进行过改良,如 SUMAN 等提出用于雷达降水临近预报的深度生成模型,并提高了预测质量、预测一致性[26]。李亚蒙等通过利用长短时记忆网络(Long Short-Term Memory,LSTM) 模型对太平洋浮标的历史数据进行分析,建立了一种 24 h 短期海表面风速预测模型[27]。
-
CNN 则是在每个卷积层中存在特征捕捉器,能够通过滚动卷积层实现对海洋环境数据局部环境的挖掘,其具有局部感知、参数共享和稀密交互等优点,往往在海洋环境科学研究中被用于数值模式输出的后处理问题,如极端海洋天气预报等。 LIU 等[28]开发了深层 CNN 架构,用于对热带气旋、大气河流和天气锋面进行分类。该系统实现了相当高的分类准确率,范围从 89%~99%。这一成果为模式检测问题提供了新思路,将用于量化当前和未来气候情景中的气候极端事件趋势,以及研究全球变暖中极端事件的动力学和热力学变化。QI 等通过将注意力机制引入到 CNN 模型中,建立了印度洋温盐结构反演模型,发现注意力机制的添加有助于提高 CNN 模型在同时反演印度洋温盐结构的准确性报[29]。
-
迄今为止,由于传统算法的局限性,很少有研究使用深度学习模型对地球科学中的高维多元建模进行研究[30],CNN 和 RNN 的一些固有特性阻碍了它们在高维多元建模中的应用。一方面,随着输入字段分辨率的增加,CNN 模型需要堆叠在许多层中以捕获空间遥相关,这使得模型过于复杂,并且消耗了大量的计算资源。另一方面,RNN 的不可并行性和消失梯度问题使得从输入数据中学习长程序列依赖关系成为一项挑战。
-
在此前提下,一种名为 Transformer[31]的基于自我注意力的架构及其变体因其可扩展性、效率和强大的迁移能力而成为自然语言处理和图像分类任务的标准模型。Transformer 架构消除了卷积和递归操作,并用自关注机制取而代之,以并行建立多变量关系,而不管它们的空间和时间距离如何。现在,尽管这种深度技术在高维气候系统建模方面具有相当大的潜力,但它尚未在地球科学中得到广泛应用。
-
在这个方向下,ZHOU 等提出了一种基于 Transformer 的变体模型的创新应用,称为 3D Geoformer,用于时空多元预测,并解释了时空自我注意机制 [32]。进一步的预测示例展示了其卓越而稳健的建模能力;该技术特别适用于捕捉厄尔尼诺与南方涛动现象演化过程中大气和海洋异常之间的非局域长程联系。具体而言,选择 3 个基本的海洋和大气变量来训练 3D Geoformer 模型,包括海面纬向(τx)和经向风应力(τy),以及上层 150 m (5 m、20 m、40 m、60 m、90 m、120 m 和 150 m) 的 7 层海洋温度异常。这些变量由反馈形式参与的物理相互作用组成,为模型预测的实现提供了理论解释。
-
表1 罗列了 3 种模型在海洋预报技术方面各自的优势和劣势。
-
2 海洋智能预报大模型研究进展
-
在智能预报领域,由于海洋预报本身物理机制特性,在模型中融入物理机制时需要对模型进行相应的调整,增加了处理难度。目前海洋方面的人工智能探索还处于初期阶段,这为大模型提供了巨大的机会。接下来重点介绍在海洋预报大模型领域应用的前沿研究进展。
-
2.1 全球海洋建模系统 AI-GOMS
-
清华大学与华为先进计算与存储实验室合作提出的全球海洋建模系统(AI-driven Global Ocean Modeling System,AI-GOMS)是一个基于傅立叶的编码自回归模型(Masked Autoencoder,MAE) 结构的预训练模型和一个轻量的微调模型组成,使用人工智能(Artificial Intelligence,AI)方法实现端到端的替代模型,可以脱离数值模式独立运行,并实现如海水温盐流、海表高度的预测[33]。
-
AI-GOMS 的模型架构中海洋模式是格点状的输入,作者采取类似视觉转换的操作,将二维格点数据转变成一维序列,便于后期编码。在该过程中模型对输入进行了随机掩码(Random Mask)处理,以此方模型能够学习到数据内在的特征,降低过拟合效应,从而得到更好的长期预测效果。经过随机掩码之后的数据,经过傅立叶模型把输入映射到频域空间。后续解码模型会在频域空间对傅立叶模型输出的特征进行适当的筛选,选取有利于预报的要素特征,最后再得到基础的海洋要素预报。
-
图2 AI-GOMS 模型示意图
-
Fig.2 Schematic diagram of AI-GOMS model
-
基于上述的基础要素预报,XIONG 等提出了 3 个下游预报(Downstream Module),包括生化要素预报、下采样、海浪预报。由目标分析输出基础要素值后,与下游任务的额外输出进行结合,再通过轻量级的微调网格从而得到下游的输出。对不同的下游预报,其输入和相应的轻量级微调网格存在区别。生化要素预报和海浪预报的微调网格均是一维,下采样中为 1/12 度的高分辨率格点数据。
-
2.2 全球高分辨率海洋预报大模型“羲和”
-
国防科技大学气象海洋学院联合复旦大学大气与海洋科学系、中南大学计算机学院等单位,研制了数据驱动的全球 1/12 度高分辨率海洋预报大模型“羲和”。“羲和”在 Swin-Transformer 架构基础上,引入了 Ocean-Land Mask 机制和组传播机制,以排除陆地区域数据对模型学习的影响,使模型能够专注于学习海洋环境的内在机理。并设计实现了 Ocean-specific Block,使模型训练的计算复杂度与输入数据的大小成线性关系,并通过“组传播机制”学习海洋环境之间的遥相关关系[34]。
-
“羲和”利用 1993–2017 年之间共 25 年的海洋再分析数据、大气再分析数据以及海表面温度卫星观测数据进行训练,“羲和”基于单块 GPU 卡,使用平均 3.6 s 的时间,即可完成全球海洋环境 10 d 的预报。
-
图3 羲和模型示意图
-
Fig.3 Schematic diagram of XiHe model
-
“羲和”可生成长达 60 D 的海流预测结果,在盐度剖面、海水温度剖面、海平面高度、海表流场等要素上预报准确率优于世界先进的海洋环境业务预报系统 Ocean Physical SYstem 的 10 d 预报结果。
-
根据仿真试验得到的海面温度在不同深度下得到的预测结果,羲和在几乎整个深度的温度变量方面始终优于其余 4 个数值预报系统,在 100 m 以下的深度尤其出色。对于 100 m 以上的温度分布,羲和的结果并没有比数值全球海洋预报系统有显著改善。羲和的预测误差略大于 Forecast Ocean Assimilation Model 和 Global Ice Ocean Prediction System,与 BLUElinK OceanMAPS 相当,优于 Ocean Physical SYstem。这可能是因为羲和对浅层温度的预测能力受到再分析数据的限制。Ocean Physical SYstem 也来自与该再分析数据相同的预报系统,在浅层温度预报方面表现不佳,这一事实也支持了这一点。然而,尽管存在这一局限性,羲和仍然明显优于 Ocean Physical SYstem,并显示出更强的预测能力的潜力,未来训练的再分析数据的质量将得到提高。
-
2.3 全球海浪波高深度学习降尺度模型 GSDNet
-
自然资源部海洋一所海洋环境科学与数值模拟重点实验室联合山东大学软件学院、华为北冥实验室等单位在海浪波高智能降尺度模型方面取得新进展,发展了一个全球海浪波高深度学习降尺度模型 (Global location-Specific transformation Downscaling Network,GSDNet),能以高精度将空间低分辨率波高数据快速映射到高分辨率网格[35]。
-
图4 全球海浪波高深度学习降尺度模型示意图
-
Fig.4 Schematic diagram of GSDNet model
-
目前高分辨率已成为海浪模拟和预报的主要发展趋势之一。然而,在追求精细化模拟和预报的同时,如何平衡高分辨率模拟和预报的计算效率和时效性成为一个关键问题。将粗分辨率映射到高分辨率的降尺度方法是目前常用的一个解决方案,传统插值降尺度计算简单,但精度不足,特别是大值的处理;而动力降尺度精度高但是计算复杂。最近流行的深度学习方法为高精度高性能的降尺度带来了契机和挑战。
-
针对全球海浪波高高精度高性能的降尺度需求,该研发团队基于 NAFNet(Non-Autoregressive Fusion Network)模型,引入海陆分布标识,设计了一种针对海陆分布的全球位置信息变换算法,使得模型能够捕获复杂区域的精细特征,从而提高模型在海陆边界的降尺度能力,并在损失函数中剔除所有陆地点来进一步提高整体模型的精度,进而建立了全球海浪波高深度学习降尺度模型 GSDNet。
-
结果表明,与双线性插值、距离反比作为权重插值、双三次插值等诸多传统数值插值方法相比, GSDNet 模型能将全球平均均方误差降低了 77%以上;与 FourCastNet(FCN)、Koopman Neural Operator (KNO)、经验残差降尺度、原始 NAFNet 等多种主流深度学习方法相比,均方差至少下降了 21%。尤其是由于引入了发展的海陆分布的全球位置信息变换算法,GSDNet 模型在海陆边界以及最大值的降尺度能力上明显优于其它主流降尺度方法。比如,在地形复杂的印太交汇处的岸界区域,GSDNet 的均方差较传统数值插值方法下降 97%以上,较文中提到的其他深度学习方法下降 60%以上。此外, GSDNet 还具有较好的泛化性,能通过低计算成本的微调策略(冻结底层权重,仅仅保留特定的层进行训练)广泛应用于任意相同降尺度比例的低分辨率数据集到高分辨率数据集的映射任务。
-
该探索性工作为高分辨率海浪以及海洋环境的精准模拟和预报提供了一个有效的解决方案,也有力促进了人工智能和海洋模拟的深度融合。目前,模式研发团队已经实现了海浪模式(水平 1/2 度分辨率)和 GSDNet 模型(4 倍降尺度)的在线耦合,在达到全球 1/8 度海浪模拟效果的同时,计算时间缩短了 12 倍。
-
2.4 海洋大数据分析预报技术
-
国家海洋信息中心在海洋大数据标准体系、分析预报关键技术和模型算法等方面取得了重要创新突破。率先建立了海洋大数据标准体系和技术架构,引领了大数据在海洋领域从概念到实践应用的突破和发展;突破了多源多模态海洋时空大数据融合分析、海洋多要素时空关联挖掘和海洋大数据深度学习智能预报等关键技术,创新发展了适用于海洋的大数据分析预测预报方法;构建了高精度高时效的海面温度、海面动力高度和水下三维温盐等大数据分析预报模型,并首次探索实现了海面到水下的一体化智能预报,形成了数据驱动的高精度、高时效、自主化的海洋环境智能预报新技术和新路径,成果达到国际领先水平[36]。
-
该数据分析技术在海洋环境预报减灾、海上航行安全、海上应急救援等领域广泛推广应用,作为 “中国技术”输出至马来西亚国家级数据中心建设,促成中欧海洋大数据长效合作。依托该项成果,国家海洋信息中心深入开展“基于大数据和人工智能的海洋环境快速预报技术研究与应用”研发,重点面向水面水下航行安全、海洋环境保障、海上生产作业的重大需求,建立数据驱动与物理约束相结合的智能预报算法来提高精度,加入质量、动量、能量守恒等将预报时效由 0~7 d 拓展到 0~30 d,增加声学、跃层、海洋锋、中尺度涡、海浪、海雾等急需要素,重点研发轻量化技术,实现水面水下随行快速预报保障和无通讯条件下的长航时自主预报保障。目前技术研发已进入模型验证和系统集成阶段。
-
图5 海洋大数据分析预报技术模型示意图
-
Fig.5 Schematic diagram of ocean big data analysis and forecast technology model
-
3 海洋智能预报大模型在装备应用领域的研究展望
-
3.1 海洋智能预报面临的挑战
-
尽管数据驱动模型在大气天气预报中取得了可喜的成果,但由于以下 2 个挑战,如何建立更准确、更高效的数据驱动海洋预报模型仍然是一个悬而未决的研究问题。首先,与在大气空间中相互连接不同,海洋分为几个由于大陆和岛屿的存在,具有特定水团性质的相对独立的区域。因此,自动学习不同海域的内部变化规律和相互影响机制变得更加困难;其次,典型运行全球海洋预报系统的水平分辨率(1/12 s)远高于数据驱动的全球天气预测系统的水平分辨率,由于训练基于深度学习的全球中期天气预测模型需要大量的计算资源和时间,因此需要开发一个高水平分辨率(1/12 s)且更加高效的数据驱动式全球海洋预测模型。
-
此外,与气象预报大模型类似,随着深度学习算法的融入,智能预报大模型还存在 4 类问题与挑战:1)对其预报的结果缺乏物理机制层面的解释;2)考虑泛化和相比传统模式的迁移成本问题;3)处理非线性系统时的过平滑问题;4)深度学习框架对微积分的支持问题。
-
3.2 海洋预报大模型在装备应用领域的展望
-
在信息化时代,海洋智能预报大模型技术必然是组成我国海洋强国战略发展的重要一环,其能够为气候、生态、灾害等领域提供可靠的科学依据,为人类感知、预测物理世界提供丰富的信息,具有巨大的经济科研价值;海洋智能预报大模型提供的海洋预报信息,可以提高要素的准确性并延长要素预测周期,在国家海洋安全战略角度同样具有极大的装备应用前景。
-
为实现海洋智能预报大模型在装备上的应用,分析后续研究将关注以下几个方面:
-
1)在数据算法方面。结合物理特征,从海洋物理学的角度对数据进行特征挖掘,或者通过数学方法、统计学或机器学习进行数据优化;不同海域可能适用不同的方法,将 AI 与海洋数值模型、统计模型和大数据相结合,形成一个数据采集预测系统,以弥补彼此的不足,有效地提高预测效果;同时考虑可能出现的海洋环境实时数据缺失、错误等问题,及海量数据快速处理和复杂计算等需求,完善数据处理技术
-
2)在模型优化方面。目前海洋预报领域的大模型处在起步阶段,视觉转换的改进模型以及生成式的模型都可以与这个领域的问题进行结合并开展工作。在未来,海洋物理机制和深度学习的结合可以成为一个有意义的研究课题。此外,由于海洋上的观测数据获取成本较高,海洋的观测比较依赖卫星数据。随着我国风云卫星的发射,结合卫星、海洋预报模式及大模型或许是以后研究的一个重要方向,并在实际应用中带来巨大工程效益。
-
3)在装备应用方面。首先海洋智能预报大模型与海洋现象识别装备结合,可提升数据利用率。当前对海洋过程识别主要集中在雷达图像上,将海洋识别装备与大模型结合,提高对地球同步卫星图像的利用率,可在一定程度上克服复杂成像条件造成的干扰,提高海洋现象识别装备(如成像仪等) 的可靠性;其次,针对当前船舶或各类水下航行器搭载的海洋要素观测装备,智能大模型的发展,能够有效提高要素观测装备的适用领域及分析能力。比如,针对水下目标噪声逐渐降低、水下环境复杂的特点,深度学习方法能够优化信号探测与识别方法,对复杂的动态特性与非线性特性进行建模,准确探测目标信号,提升装备探测能力;此外,在海洋要素预测方面,当前深远海航行过程中往往面临海洋环境观测数据缺失、存在重大错误、数据计算量大等困难,海洋智能预报大模型与船舶搭载的传感器及硬件分析设备结合,能够形成新的数据采集预测系统,基于优化算法与模型,适应多样化的海域特点,有效提高预测结果,为深远海航行提供更准确的海洋环境预报,并尽可能降低硬件计算资源消耗,使预报装备适应未来小型化、无人化水下潜器的趋势。
-
总体而言,进行海洋智能预报大模型在航海装备结合研究过程中,需要考虑各种实际使用场景和应用条件,提高模型对更复杂条件的兼容性和稳健性。为适应深远海战略发展,降低算法对硬件资源的消耗和依赖,研究高效的数据存储方法,推进海洋智能预报与其他前沿技术的融合,包括分布式数据库、数据挖掘、数字孪生等,开拓应用领域。同时扩大智能预报模型的预测覆盖面,尤其是针对局部极端气象的预报能力,为海洋预报大模型赋能,提供海洋预报和智能决策支持。
-
4 结束语
-
基于深度学习的气象预报是当前热门的研究方向,海洋预报大模型通过收集、处理不同来源与时空的观测资料,对海洋关键要素提供未来演替的预测。当前我国海洋智能预报领域的研究,在优化模型构建、延长预报周期、提高预测精度等方面进展迅速,处于世界领先水平。但数值预报、人工智能与海洋预报,因其内在的物理机制和硬件依赖,限制了海洋智能预报的发展,特别是在与装备应用结合的领域,解决上述问题,实现精细化、低成本与自适应的海洋智能预报大模型构建,将成为海洋强国战略发展的重要支撑。
-
参考文献
-
[1] SONNEWALD M,LGUENSAT R,JONES D C,et al.Bridging observations,theory and numerical simulation of the ocean using machine learning[J].Environmental Research Letters,2021,16(7):073008.
-
[2] HURLBURT H E,CHASSIGNET E P,CUMMINGS J A,et al.Eddy-resolving global ocean prediction[J].Ocean Modeling in an Eddying Regime,2008,177:1029.
-
[3] FOX-KEMPER B,ADCROFT A,BÖNING C W,et al.Challenges and prospects in ocean circulation models[J].Frontiers in Marine Science,2019,6,65:125142.
-
[4] REICHSTEIN M,CAMPS-VALLS G,STEVENS B,et al.Deep learning and process understanding for data-driven Earth system science[J].Nature,2019,566(7743):195-204.
-
[5] DÜBEN P,MODIGLIANI U,GEER A,et al.Machine learning at ECMWF:a roadmap for the next 10 years[EB/OL].[2021-01-10].https://www.ecmwf.int/en/elibrary/81207-machine-learning-ecmwf-roadmap-n ext-10-years.
-
[6] AIRES F,WESTON P,ROSNAY P,et al.Statistical approaches to assimilate ASCAT soil moisture information[J].Quarterly Journal of the Royal Meteorological Society,2021,147(736):1823-1852.
-
[7] PATHAK J,SUBRAMANIAN S,HARRINGTON P,et al.FourCastNet:a global data-driven high-resolution weather model using adaptive Fourier Neural Operators [EB/OL].[2024-07-27].http://arxiv.org/abs/220211214.
-
[8] NGUYEN T,BRANDSTETTER J,KAPOOR A,et al.Climax:a foundation model for weather and climate [EB/OL].[2024-07-27].http://arxiv.org/abs/2301.10343.
-
[9] CHEN K,HAN T,GONG J C,et al.Fengwu:pushing the skillful global medium-range weather forecast beyond 10 days lead[EB/OL].[2024-07-27].http://arxiv.org/abs/2304.02948.
-
[10] UMLAUF L,BURCHARD H.A generic length-scale equation for geophysical turbulence models[J].Journal of Marine Research,2023,61(2):235-265.
-
[11] CHASSIGNET E P,HURLBURT H E,SMEDSTAD O M,et al.The HYCOM(hybrid coordinate ocean model)data assimilative system[J].Journal of Marine Systems,2007,65:60-83.
-
[12] CHEN C S,BEARDSLEY R,COWLES G.An unstructured grid,finite-volume coastal ocean model(FVCOM)system[J].Oceanography,2006,19(1):78-89.
-
[13] SMEDSTAD O,O’BRIEN J.Variational data assimilation and parameter estimation in an equatorial Pacific Ocean model[J].Progress in Oceanography,1991,26(2):179-241.
-
[14] ANDERSON D L,SHEINBAUM J,HAINES K.Data assimilation in ocean models[J].Reports on Progress in Physics,1996,59(10):1209-1266.
-
[15] 余璇.基于数据驱动关系依赖的海洋环境大数据预报方法研究[D].上海:上海大学,2021.
-
[16] BARTHOLOMEW D,BOX G,JENKINS G.Time series analysis forecasting and control[J].Journal of the Operational Research Society,1971,22(2):199-201.
-
[17] CORTES C,VAPNIK V.Support vector network[J].Machine Learning,1995,20(3):273-297.
-
[18] CHEN X X,JIANG Z S,CHENG H,et al.A novel global average temperature prediction model based on GM-ARIMA combination model[J].Earth Science Information,2024,17:853-866.
-
[19] MALIK A,TIKHAMARINE Y,SOUAG-GAMANE D.et al.Support vector regression optimized by meta-heuristic algorithms for daily streamflow prediction[J].Stochastic Environmental Research Risk and Assessment,2020,34:1755-1773.
-
[20] LEVIN L,BETT B,GATES A,et al.Global observing needs in the deep ocean[J].Frontiers in Marine Science,2019,6:241.
-
[21] FRANCIS P,JITHIN A,EFFY J,et al.Highresolution operational ocean forecast and reanalysis system for the Indian Ocean[J].Bulletin of the American Meteorological Society,2020,101(8):1340-1356.
-
[22] BI K F,XIE L X,ZHANG H H,et al.Accurate medium-range global weather forecasting with 3D neural networks[J].Nature,2023,619(7970):533-538.
-
[23] LAM R,SANCHEZ-GONZALEZ A,WILLSON M,et al.GraphCast:learning skillful medium-range global weather forecasting[EB/OL].[2022-12-24].https://arxiv.org/abs/2212.12794.
-
[24] METZGER E J,SMEDSTAD O M,THOPPIL P G,et al.US navy operational global ocean and Arctic ice prediction systems[J].Oceanography,2024,27(3):32-43.
-
[25] CHEN L,ZHONG X H,ZHANG F,et al.FuXi:a cascade machine learning forecasting system for 15-day global weather forecast[EB/OL].[2024-07-27].http://arxiv.org/abs/2306.12873.
-
[26] SUMAN R,KAREL L,MATTHEW W,et al.Skilful precipitation nowcasting using deep generative models of radar[J].Nature,2021,597(7878):672-677.
-
[27] 李亚蒙,孙宝楠,丁军航,等.基于LSTM的海洋表面短期风速预测研究[J].海洋科学,2022,46(11):55-66.
-
[28] LIU Y J,RACAH E,PRABHAT,et al.Application of deep Convolutional Neural Networks for detecting extreme weather in climate datasets[EB/OL].[2016-05-04].http://www.arxiv.org/abs/1605.01156.
-
[29] QI J F,XIE B W,LI D L,et al.Estimating thermohaline structures in the tropical Indian Ocean from surface parameters using an improved CNN model[J].Frontiers in Marine Science,2023,10:1181182.
-
[30] MU B,QIN B,YUAN S J.ENSO-ASC 1.0.0:ENSO deep learning forecast model with a multivariate air-sea coupler[J].Geoscientific Model Development,2021,14:6977-6999
-
[31] VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need[C]//The 31st International Conference on Neural Information Processing Systems.Long Beach:IEEE,2017.
-
[32] ZHOU L,ZHANG R H.A self-attention-based neural network for three-dimensional multivariate modeling and its skillful ENSO predictions[J].Science Advances,2023,9(10):adf2827.
-
[33] XIONG W,XIANG Y F,HUANG X,et al.AI-GOMS:large AI-driven global ocean modeling system[EB/OL].[2023-08-06].http://arxiv.org/abs/2308.03152.
-
[34] WANG X,WANG R Z,HU N Z,et al.XiHe:a data-driven model for global ocean eddy-resolving forecasting[EB/OL].[2024-02-05].http://arxiv.org/abs/2402.02995.
-
[35] WU X Y,ZHAO R,CHEN H Y,et al.GSDNet:a deep learning model for downscaling the significant wave height based on NAFNet[J].Journal of Sea Research,2024,198:102482.
-
[36] 国家海洋信息中心.国家海洋信息中心科技成果“海洋大数据分析预报技术研发与示范应用”荣获2022年海洋科学技术奖一等奖[EB/OL].(2023-12-18)[2024-07-27].https://www.nmdis.org.cn/c/2023-12-18/80055.shtml.
-
摘要
全球海洋预报大模型与大数据应用、气象预报模型发展密不可分,简述了基于深度学习的人工智能技术在气象预报、海洋预报中的应用和特点。重点报告了我国各科研机构在全球海洋预报大模型领域的研究现状。结果表明,当前在数据驱动建模、海洋大数据分析、海洋要素智能预报等领域研究达到世界领先水平,预报周期、关键预测准确率超过目前世界先进预报系统。最后,结合海洋强国战略,分析并展望了海洋智能预报在装备应用领域发展中存在的挑战,考虑海洋安全背景下针对数据处理和装备应用等方面的研究方向。
Abstract
The development of global ocean forecasting models is closely related to the application of big data and meteorological forecasting models. In this article,the application and characteristics of artificial intelligence technology based on deep learning in meteorological and ocean forecasting is briefly described. The article focuses on the research status of various scientific research institutions in China in the field of global ocean forecasting big models. The results indicate that current research in data-driven modeling,ocean big data analysis,and intelligent forecasting of ocean elements has reached a world leading level,with forecasting cycles and key prediction accuracy exceeding advanced forecasting systems in the world. Finally,based on the strategy of building a strong maritime nation,the challenges in the development of ocean intelligent forecasting in the field of equipment application are analyzed and discussed,and the research directions for data processing and equipment application in the context of maritime security are put forward.
Keywords
ocean forecasting ; intelligent forecasting ; big model ; artificial intelligence