0
本文作者: 包永刚 | 2025-10-11 18:39 |
9月底在美国亚利桑那州举办的Intel Tech Tour(ITT)上,英特尔预览了即将在明年正式推向市场的两款拳头产品,代号Panther Lake的英特尔酷睿 Ultra处理器(第三代)PC级处理器,以及代号Clearwater Forest的英特尔至强6+服务器处理器。
这两款全新的处理器的共同特点是基于领先的intel18A制造工艺,以及背部供电技术PowerVia。
“两者结合,强上加强。”英特尔公司客户端计算事业部副总裁兼中国区总经理高嵩说,“Intel 18A制程技术的引入,至少为我们接下来三代产品的推出奠定了坚实基础。”
对于服务器处理器至强6+而言,3D封装技术Foveros Direct 3D也至关重要,先进制程+背部供电+先进封装是至强6+能够实现创纪录的288核服务器CPU的关键。
“Intel18A实现了更高的单元(cell)密度,结合3D堆叠封装技术,可将三级缓存与CPU Compute Die解耦。”英特尔技术专家对雷峰网(公众号:雷峰网)表示,“解耦之后就可以摆脱原来核心密度受到单个芯片尺寸的限制,可以将处理器核心数量从144个翻倍到288个。”
对于英特尔来说,这应该是一种久违的自豪感。芯片产业最重要的环节莫过于设计和制造,设计一直是英特尔的强项,但制造技术英特尔在过去几年间面临挑战,如今重回世界领先水平的Intel 18A的量产,让英特尔的拳头产品的产品力拥有了大幅领先竞争对手的机会。
创造了整个CPU行业核心数量纪录的至强6+ CPU,正是英特尔技术和产品力再次引领行业的积极信号。
RibbonFET+背部供电技术,英特尔未来三代产品的基石
过去几年间,AMD产品的成功离不开台积电全球领先的制造工艺,与此同时英特尔面临的巨大压力也来自其制造工艺遭遇问题。特别是,无论是在PC级处理器市场还是服务器处理器市场,Arm架构处理器都获得了不小的成绩,也给英特尔增加了不少压力。
这也更能体现出Intel 18A对于英特尔的重要性,只有拥有了全球领先的制造工艺,才能让英特尔的产品具备显著的竞争优势,毕竟在芯片这个高度竞争的行业里,只有设计和制造能力顶尖才能拥有顶级的芯片产品。
Intel 18A非常关键的是栅极环绕技术。过去数十年间,晶体管从二维的MOSFET,到了三维的FinFET,Intel 18A采用了最新的三维堆叠RibbonFET。
简单来说,栅极环绕RibbonFET可以进一步增强晶体管开关控制、响应速度,还能够显著抑制漏电。其优势在于同等频率下能够降低工作电压,或者在同等工作电压下提升驱动能力,每瓦性能的显著提升。同时,通过调节纳米片的宽度和层数,搭配上工作电压的不同阈值,可以在同一工艺平台上衍生出高性能或者低功耗等多种晶体管规格,拥有更高自由度。
“RibbonFET技术不仅是物理尺寸上的微缩,还是对整个晶体管控制理念的重大创新,重新定义了控制逻辑,为下一步尺寸缩减预留了空间,可以让摩尔定律在Intel 18A及后续的节点上继续延展。”英特尔技术专家表示。
RibbonFET的创新想要发挥出全部价值,还需要PowerVia背部供电技术。
传统晶体管顶部堆叠多层金属互连层,用于供电和信号传输。然而随着晶体管的密度接近物理极限,正面的布线已经非常拥挤。PowerVia改变了原有的思路,将供电网络下沉到晶圆背部,晶圆正面只保留了信号连接,这样被供电线占据的正面走线空间被释放,布局堵塞问题马上就被缓解。
但要将供电网络下沉到晶圆背面,背部供电需要采用纳米级的TSV(硅通孔),这种TSV是常用TSV的1/10,通过纳米级TSV可以直接通过更短的路径将电源从封装传递到晶体管内部,从而实现更高的电源布线效率。
根据测算,结合RibbonFET和PowerVia,可以将单元利用率提高10%,在相同功耗下性能提高4%。
英特尔技术专家指出,“RibbonFET技术可以释放晶体管的潜能,PowerVia又为扫清了供电障碍,这两个技术共同支撑起了Intel 18A制程在密度和能效上的同步提升。”
通过RibbonFET和PowerVia的结合,英特尔给出的数据是,相较于上一代工艺,Intel 18A的芯片密度提升到了前一代的1.3倍,有30%巨大提升,这意味着可以用更小的芯片尺寸,更低能耗实现更高性能。
另外,相比上一代工艺,在相同功耗下,每瓦性能提升超过15%,如果达到相同的性能,功耗降低超过25%。
实际上,除了英特尔,业界其他领先的芯片制造工厂也都在研究能给芯片带来显著收益的栅极环绕和背部供电技术,谁能率先量产就更有机会占领先机。
“Intel 18A制程工艺已经开始量产,这个量产是在亚利桑那州Fab-52工厂开始,今年年底之前会有一个产量爬坡的过程。”高嵩表示。
英特尔技术专家透露,“对比当前Intel 18A的生产数据以及过往15年里英特尔各个核心技术节点的数据,Intel 18A当前的良率大于等于之前每一代节点。我们预计Intel 18A 在2025年四季度能够达成大规模量产的良率目标。”
有了领先的先进制程作为基石,设计的提升将变得更加容易。
288核服务器CPU成功的关键——3D封装
开篇已经解释过了3D封装对于至强6+(Clearwater Forest)实现288核的重要作用,通过Clearwater Forest的架构能够更深刻地理解3D封装的重要价值。
Clearwater Forest的最上层是计算模块(蓝色),支持12个计算单元,每个计算单元包含24个Darkment能效核。这12个计算模块通过Foveros Direct 3D技术焊接在3个有源基板上。
这里有两个关键,第一个是Foveros Direct 3D可以支持9微米量级的凸点间距,支持铜对铜的键合。Foveros技术原理并不复杂,难点在于多个Die堆叠的时候,连接的精密度、以及整个拼接的完整度、信号的稳定性,以及全面封装之后的良率。
“Foveros Direct 3D可以实现高密度、低电阻的晶片间互联,可以达到0.05pJ/bit的功耗/比特性能,0.05pJ大概是2.5D技术所能达到的功耗的1/10。”英特尔技术专家说,“利用Intel 18A和Foveros Direct 3D技术,可以将Clearwater Forest的能效比达到前所未有的新高度。”
第二个关键是计算模块通过3D封装连接的是有源基板。
“Clearwater Forest有源硅基板并不是传统的简单工艺,而是采用Intel 3工艺来支持更高的互联以及三级缓存。”英特尔技术专家强调,“有源硅基板除了能够完成Die和Die之间的互联,还可以引入一些先进的逻辑和存储单元,从而实现更高的跨die间的互联以及更大的三级缓存。”
回到Clearwater Forest的架构,三个有源硅基板和分布在左右的两个I/O单元,通过EMIB形成2.5D的互联。最终,Clearwater Forest在一个非常小的尺寸里堆叠了29个芯片。
堆叠带来的性能和能效收益很高,但也会面临更严峻的散热挑战。
英特尔技术专家对雷峰网表示,“3D封装在横向散热过程当中带来了更大的热阻,确实在散热上会有更高的要求。PowerVia 的金属供电层分布在晶圆背部,也在一定程度上有助于导热。”
“另外,至强6+的设计目标是希望无缝兼容当前的至强6平台,因此已经考虑到了功耗的要求以及散热的系统边界条件,所以我们针对至强6+散热上做了比较大幅度的优化,能够在核数增加、算力堆叠技术之后,依然可以维持CPU 500W的TDP的目标。”英特尔技术专家同时表示。
至强6+上使用的I/O单元和至强6的性能核处理器一致,可以实现无缝升级,这也是即将发布的Clearwater Forest即便实现了巨大的性能飞跃,名称是至强6+而非至强7的关键原因所在。
但需要指出的是,288核的Clearwater Forest基于Birch Stream AP服务器主板平台。这意味着,如果客户当前使用Granite Rapids AP服务器系统,可将Granite Rapids CPU平滑替换为Clearwater Forest CPU,无需任何硬件改动,仅需软件更新即可直接使用。如果是使用至强6E能效核的系统,无法直接替换Clearwater Forest AP CPU。
微架构升级,至强6+计算性能翻倍
制程以及封装技术让至强6+实现了更好的性能和能耗,Clearwater Forest的CPU内核微架构上也实现了非常大幅度的提升。
对比Sierra Forest(至强6E)所用的Crestmont的内核,Clearwater Forest使用的Darkmont内核在指令解码、分配、微操作队列、缓存窗口以及指令派发等方面都带来了30%-50%不等的性能提升。
算力单元的提升更加显著,包括标量算术逻辑单元、向量算术逻辑单元、地址生成单元、二级缓存带宽上都实现了翻倍的提升,从4个算术单元提升到8个,从2×128bit的向量计算,提升到4×128bit向量计算。
基于大量的提升,Darkmont相比Crestmont,在相同功耗情况下,可以带来每核IPC 17%的性能提升。
如果把整个功耗和性能的影响算在一起,相比Crestmont,至强6+处理器的Darkmont可以带来1.9倍以上的性能提升,同时在整体负载范围之内带来高达23%的能效提升,可以达到8:1服务器整合的效果。
这就意味着如果将至强6+和第二代的至强处理器进行横向对比,使用20台机架180台至强6+服务器就可以替代70个机架1400台第二代英特尔至强服务器,也就是8:1的服务器整合比例。
同时由于服务器和机架功率降低,可以降低整机功耗750KW,降低71%的数据中心占用空间,同时提升3.5倍的性能/功耗比,每台机架上也可以增加2.3倍的虚拟机部署数量。
除此之外,Clearwater Forest还有内存、安全性等方面的升级,支持多达12条8000MT/s DDR5,整个Clearwater Forest支持576MB的末级缓存以及96条PCIe Gen 5的I/O通道,其中有64条支持最新的CXL技术。
Clearwater Forest还引入了英特尔最新的应用能耗监测功能以及内置了完备的安全防护功能,即TDX和SGX。
从设计、制造到封装,Clearwater Forest每一个环节都实现了飞跃,将三项提升叠加,Clearwater Forest能够带来的性能和能效的提升将会远超普通的产品代际升级,这是一次跨越式的升级,至于具体的产品以及最终的产品力表现,期待2026年至强6+的正式发布。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。