CVPR 2026 | 根本不用训练！工业异常分割也能跨类别直接上产线！

本文作者：陈淑瑜

2026-05-26 11:49

专题：CVPR 计算机视觉与模式识别会议

导语：无需训练的跨类别异常分割——CVPR 2026 VAND Workshop 工业赛道

来源：公众号“机工智能AI科研”

原文链接：https://mp.weixin.qq.com/s/6Nw8B_EDJCjfIikW_lseXA

论文链接：https://arxiv.org/abs/2605.14808
项目开源地址：https://github.com/LukasRoom/SuperADD
作者：Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer
单位：Fraunhofer IOSB（德国弗劳恩霍夫光电、系统技术及图像处理研究所），Independent Research
会议：CVPR 2026 VAND 4.0 Workshop Challenge Industrial Track

工业异常检测现在不缺模型，缺的是能扛产线波动的模型。

真实工厂里，光照会漂、曝光会变、批次会换，相机位姿也可能微调。很多方法在实验室里指标很好，一到产线就误检、漏检。更麻烦的是，不少方案还要按类别重训、按产品调阈值，每上一条新线，算法团队都要重新建库、验证、调参，交付成本很高。

SuperADD 这篇 CVPR 2026 工作，切的就是这个痛点：能不能用单一架构、一组统一超参、零训练流程，完成跨类别工业异常分割？

01 这篇卷的不是模型，而是上线能力

SuperADD 的关键词很明确：training‑free、class‑agnostic、distribution shift robustness。

它不为每个产品单独训练模型，也不依赖类别专属超参，而是用一套固定 pipeline 跑 MVTec AD 2 的 8 个工业类别。这个设定更贴近真实生产：产线不会给你充足异常样本，也不会允许每次换线都重新训练。

所以这篇的价值，不是单纯刷榜，而是把工业 AD 从“一类一训”推向“统一部署”。

CVPR 2026 | 根本不用训练！工业异常分割也能跨类别直接上产线！ — SuperADD 方法总览图：展示 Train Images / Test Image 经过 Overlapped Patches、Frozen DINOv3、多层特征记忆库后生成 Anomaly Map 的流程

02 方法主线：大骨干提特征，记忆库做检索

SuperADD 继承了 SuperAD / PatchCore 的 memory bank 路线。

训练阶段不更新网络权重，只用正常样本抽取特征，构建正常特征库。测试时，将待检测图像的 patch 特征与 memory bank 做近邻匹配。距离越远，越可能是异常。

它使用 DINOv3‑ViT‑H+/16 作为视觉骨干，并抽取第 7、15、23、31 层特征。浅层看纹理和边缘，深层看结构和语义，多层融合能覆盖划痕、污渍、缺口、结构破损等不同缺陷形态。

这套方案很工程：不训练、不收敛、不做类别模型，用 foundation model 的通用表征能力，换部署侧的稳定性。

03 重叠切块：压住边界伪影

工业图像分辨率高，整图推理成本大；但直接切 patch，又容易在窗口边缘产生断裂和误检。

SuperADD 采用 overlapping patch‑wise inference，把图像切成带重叠区域的 patch，并保证 patch 与图像边界对齐，避免 padding 引入假特征。论文中设置 patch size 为，最小重叠为。

单维度 patch 数量计算：

其中是图像某一维度长度，是 patch 尺寸，是最小重叠宽度。

这个改动不花哨，但很实用。对 rice、walnuts、wallplugs 这类位置随机、遮挡复杂、实例堆叠的物体，重叠切块能减少网格伪影和边界漏检。

04 抗光照漂：先把变化打进正常库

MVTec AD 2 的难点不只是缺陷小，而是采集条件会变。尤其是光照漂移，会让同一个正常产品在特征空间里“看起来像异常”。

SuperADD 在正常样本特征提取前加入 intensity‑based augmentation，用随机强度缩放模拟曝光和光照变化。这样构建出来的正常特征库，不再只覆盖单一采集条件，而是覆盖更宽的正常外观分布。

阈值策略也更贴近真实上线。论文没有用测试集 GT 找最优阈值，而是从正常训练样本的 anomaly map 中估计阈值：取 95 分位数，再乘一个 gain factor。这样不需要异常标注，也避免了“测试集调参”的实验室味道。

05 后处理：把热力图变成可用 mask

工业检测不是只看热力图，最终还要落到缺陷面积、位置和形态统计。因此，异常 mask 是否连续、干净，非常关键。

SuperADD 在后处理阶段加入 iterative morphological closing，用多方向线性结构元素连接断裂区域，再通过 fill region 填补闭合孔洞，让细长划痕和边缘缺陷形成更完整的异常区域。

06 结果：统一参数下，平均 F1 最优

论文在 MVTec AD 2 上评估，包括 TESTpub、TESTpriv 和 TESTpriv,mix。核心指标是像素级 F1：

F1 分数：

结果上，SuperADD 在 TESTpub 上达到 62.61% F1；在 TESTpriv 上达到 57.42% F1；在更难的 TESTpriv,mix 上达到 54.35% F1。

表 1：TESTpub 各类别 AU-ROC0.05 与 F1 结果

更关键的是横向对比。表2 显示，SuperADD 在 TESTpriv / TESTpriv,mix 平均 F1 上达到 57.42 / 54.35，超过 PatchCore、EfficientAD、ISVL、RoBiS、ASEG、SuperAD 等方法。去年最强的 ISVL 为 53.81 / 51.43，说明 SuperADD 在分布偏移场景下更稳。

表 2：TESTpriv / TESTpriv,mix 方法对比