0
过去很长一段时间里,气候、天气和地球系统研究,几乎完全建立在数值模拟之上。超算负责把物理方程一层层算下去,模型的精度、分辨率和稳定性,决定了人类对自然系统能“看清”多少。
而近几年,随着算力条件的变化,人工智能开始被不断引入这些传统领域。尤其是在气候和地球系统建模中,AI 被寄予厚望:它是否能补足数值模型难以覆盖的细节?是否能在有限算力下,把系统看得更细一点?这些问题,正在成为超算与科学计算领域绕不开的讨论。
地球系统模型正是其中最具代表性的场景之一。从全球环流到局地天气,从海洋到大气,从公里尺度到更细微的变化,模型需要处理的过程极其复杂,也几乎不可能被完全穷尽。正因为如此,关于 AI 应该如何进入地球系统建模,学界和工程界始终保持着谨慎甚至分歧的态度。
在 GAIR 2025 大会上,围绕人工智能与科学计算的关系,相关讨论再次被集中提及。付昊桓教授在大会期间做了相关分享,结合地球系统模型与超算实践,讨论了数值模拟与 AI 之间的边界与可能性。
作为清华大学深圳国际研究生院教授、国家超级计算深圳中心副主任,他长期同时参与超算平台建设和地学计算研究,也因此更关注这些方法在现实体系中“能不能用、该怎么用”。
在GAIR 2025 现场,AI科技评论与付昊桓教授围绕数值计算与AI 的融合、地球系统模型的复杂性,以及AI 在预报体系中的真实位置进行了深入交流,相关内容AI 科技评论做了不改变原意的编辑整理:
AI 科技评论:您现在在超算这边,最核心想做的事情到底是什么?
付昊桓:其实如果从一个比较抽象的层面来总结,我们现在最核心想推动的一件事,就是数值计算和人工智能的深度融合。
地球系统只是一个比较典型、也比较容易被大家理解的例子,但并不是唯一的应用场景。类似的问题,其实在很多科学计算领域都会遇到,比如机器人、生物医药、材料科学等等。只不过地球系统的复杂性、尺度跨度和社会影响都非常突出,所以它经常被拿出来讨论。
我们并不是说要单独把 AI 拿出来做一个“更聪明的模型”,也不是简单地去提升某一个模型的精度,而是希望从根本上去思考:在科学计算这样一个长期以数值模拟为核心的方法体系中,AI 到底应该以什么样的方式介入,才能真正提升我们理解和预测复杂系统的能力。
AI 科技评论:那为什么地球系统会被您反复作为一个核心例子?
付昊桓:因为地球系统本身,几乎把科学计算中最难的几个问题都集中在了一起。首先,它是一个典型的混沌系统。我们常说的蝴蝶效应,本质上讲的是系统对初始条件的高度敏感性。哪怕是一个非常微小的扰动,在经过足够长的时间和足够复杂的相互作用之后,都可能对整体状态产生显著影响。
其次,它是一个极端多尺度的系统。比如说,台风这种现象,可能发生在数百公里到千公里的尺度上;而强对流降水则发生在公里尺度;龙卷风则是十米到百米尺度;再往下,还有更微观的过程,发生在米级甚至更小的尺度上。
更重要的是,这些不同尺度的过程,并不是彼此独立的,而是相互耦合、彼此影响的。你不能只算大尺度而忽略小尺度,也不能只盯着局部而不看整体。正是这种“所有尺度连在一起”的特性,使得地球系统成为一个非常典型、但也极其困难的研究对象。
AI 科技评论:那在这种情况下,有没有可能去做一个真正意义上的数字孪生?
付昊桓:从现实角度来看,这是基本不可能的。很多人会设想,未来算力如果足够强,是不是就可以把所有细节都模拟出来。但实际上,问题并不只是算力的问题,而是尺度本身是没有下限的。
你可以说,未来是不是可以模拟一只蝴蝶?那我会反问:树叶里的水分是怎么蒸发的?云中的水汽是如何凝结成水滴的?水滴在不同微环境中是如何增长、碰并并最终下落的?
这些过程发生在越来越小的尺度上,而且每一个尺度都会引入新的物理机制。你永远不可能把所有尺度都纳入一个完全精确的数值模型中。所以从一开始,我们就必须承认:地球系统是一个无法被完全穷尽计算的复杂系统。
AI 科技评论:在这种前提下,数值模拟的意义在哪里?
付昊桓:数值模拟的意义,恰恰在于它是我们目前唯一一套系统性地、基于物理规律去理解世界的工具。我常用一个比喻来解释数值模拟和 AI 之间的关系:数值模拟是骨骼,AI 是肌肉。
骨骼代表的是我们已经理解得比较清楚的那部分自然规律,比如守恒定律、动力学方程、热力学关系等。这些东西是有明确物理意义的,是可解释、可追溯的。
而肌肉这一侧,指的是那些我们目前很难用严格物理模型去描述、或者算力根本支撑不了的部分。这些地方,AI 可能可以发挥更大的作用。
AI 科技评论:能不能用一个更具体的例子来说明这种分工?
付昊桓:比如说台风预报。当台风从海上向陆地移动时,在百米甚至公里尺度上,它的整体动力结构是可以用传统数值模型来刻画的。但当台风进入城市环境之后,问题就变得非常复杂。
你想知道某一条街道上,风会怎么走?某一个小区里,降雨会如何分布?这些已经进入了十米、甚至一米尺度,而传统数值模型在这个尺度上不仅算力不够,物理参数化本身也变得非常困难。
在这种情况下,如果完全依赖数值模拟,成本是无法承受的。但如果完全依赖 AI,又会失去物理约束。所以一个更现实、也更有前景的方向,是让 AI 在这些“肌肉层面”去补充数值模型,而不是取代它。
所以我们最终希望看到的,不是数值模型一套、AI 模型一套,而是它们能够形成一个紧耦合的混合模型。我经常用“齿轮”这个比喻,希望这两个齿轮能够真正咬合在一起,一起转,而不是各转各的。
AI 科技评论:那在数据如此稀疏的情况下,AI 能发挥什么作用?
付昊桓:AI 非常擅长做的一件事情是:在不完整的数据条件下,给出一个合理的推断。也就是说,你给它一些稀疏的观测点,它可以在空间和时间上进行补全,给出一个 best guess。
这种能力,在地球系统这样观测受限的领域里,确实非常有价值。但前提依然是:它必须和数值模型结合使用。雷峰网(公众号:雷峰网)
AI 科技评论:那目前这些模型成果,是如何被气象部门实际采纳和使用的?
付昊桓:现在的天气预报,本身就是一个高度工程化的混合体系。以华南地区为例,目前常用的是大约一公里分辨率的网格模型。在这个尺度上,动力方程是可以直接计算的;而网格内部无法解析的微物理过程,则通过统计参数化方案来处理。
同时,还会引入多组初始条件、多种模型配置,进行集合预报。最终给出的,并不是单一结果,而是一种带有概率意义的预报结论。在这样的体系下,目前 7 天预报是可以实现的,其中 3 到 5 天相对比较可靠。
AI 科技评论:AI 的引入,在这个体系中具体带来了哪些变化?
付昊桓:从目前的测试结果来看,AI 确实在一些方面带来了提升。比如,它可以利用更多类型的数据,提升某些变量的预报精度;在部分场景下,也确实可以延长可预报时间的长度。但与此同时,问题也非常明显。
首先,AI 对极端天气的预测能力仍然不足。极端事件本身在数据中出现得就不多,而 AI 往往更擅长学习“常态”。
其次,AI 的输出结果往往偏平滑,这在视觉上可能看起来“合理”,但会掩盖一些真正重要的极端特征。
第三,它是一个黑盒。对于一线预报员来说,当模型给出一个结果时,他们很难像使用传统数值模型那样,追溯每一步计算的物理原因。
此外,传统数值模型天然包含不确定性评估机制,而 AI 原生并不具备这一能力。这在实际业务中,是一个非常关键的差异。
AI 科技评论:所以您认为,数值模拟依然是不可替代的?
付昊桓:是的,我认为数值模拟一定是整个体系的 backbone。它承载的是人类已经理解的物理规律,是可解释、可验证的。AI 的角色,不是推翻这一体系,而是在这个基础上去补充、去增强,甚至在长期发展中,帮助我们逐步“打开黑盒”。
AI 科技评论:现在越来越多科技公司进入气象和气候领域,您怎么看?
付昊桓:这个赛道确实开始变得非常“卷”。但从另一个角度看,这也说明大家普遍认为,这个领域未来还有很大的突破空间。气象和气候并不是一个“已经被解决的问题”,相反,它仍然存在大量基础性的挑战。
AI 科技评论:气象和气候的商业价值主要体现在哪里?
付昊桓:我觉得至少体现在三个方面。第一,是季节尺度预报的金融属性。如果你能提前知道某一年、某一季的大致气候情况,会直接影响农业产量、大宗商品价格等。
第二,是能源系统。风电、光伏之所以难以稳定利用,很大程度上是因为它们的不确定性。如果预报更准,能源调度和成本控制都会发生根本性的变化。
第三,是碳达峰和碳中和。地球系统模型能力的提升,会对整个上下游产业链产生深远影响。
AI 科技评论:算力和模型规模的不断扩张,真的带来了科学价值吗?雷峰网
付昊桓:从历史上看,每一轮重大技术变革在初期阶段,往往都会伴随着某种形式的泡沫。这并非偶然,而是技术潜力、资本预期与现实落地之间动态博弈的结果。互联网的发展过程在一定程度上已经呈现过类似情形。但泡沫过后,一定会留下真正有价值的能力。从长期来看,AI 很可能会像计算机一样,逐步进入所有行业,并在这个过程中,改变我们解决问题的方式。
AI 科技评论:现在学界越来越强调交叉学科,您怎么看?
付昊桓:我觉得这并不是一个新趋势,而是科学本身的属性。学科是成熟知识的沉淀,而真正的新发现,往往发生在学科交叉的地方。
AI 科技评论:未来三年,您个人最期待哪方面的突破?
付昊桓:我个人最期待的是3 到 6 个月尺度的预报能力突破。这是目前天气预报和气候预测之间的一个灰区,也是现实中非常重要、但目前还难以解决的问题。
AI 科技评论:最后,您想给准备进入这个领域的年轻人什么建议?
付昊桓:最重要的一点,是先想清楚:你为什么要做科研。如果没有内驱力,科研会变成一种消耗。我更希望年轻人是主动享受这个过程,而不是被环境推着走。
讲座完整视频,详见链接:https://youtu.be/dw4tRbvoENY
雷峰网原创文章,未经授权禁止转载。详情见转载须知。