您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给陈淑瑜
发送

0

CVPR 2026 | 根本不用训练!工业异常分割也能跨类别直接上产线!

本文作者: 陈淑瑜   2026-05-26 11:49 专题:CVPR 计算机视觉与模式识别会议
导语:无需训练的跨类别异常分割——CVPR 2026 VAND Workshop 工业赛道

 

来源:公众号“机工智能AI科研”

原文链接:https://mp.weixin.qq.com/s/6Nw8B_EDJCjfIikW_lseXA

  • 论文链接:https://arxiv.org/abs/2605.14808
  • 项目开源地址:https://github.com/LukasRoom/SuperADD
  • 作者:Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer
  • 单位:Fraunhofer IOSB(德国弗劳恩霍夫光电、系统技术及图像处理研究所),Independent Research
  • 会议:CVPR 2026 VAND 4.0 Workshop Challenge Industrial Track

工业异常检测现在不缺模型,缺的是能扛产线波动的模型。

真实工厂里,光照会漂、曝光会变、批次会换,相机位姿也可能微调。很多方法在实验室里指标很好,一到产线就误检、漏检。更麻烦的是,不少方案还要按类别重训、按产品调阈值,每上一条新线,算法团队都要重新建库、验证、调参,交付成本很高。

SuperADD 这篇 CVPR 2026 工作,切的就是这个痛点:能不能用单一架构、一组统一超参、零训练流程,完成跨类别工业异常分割?



01 这篇卷的不是模型,而是上线能力

SuperADD 的关键词很明确:training‑free、class‑agnostic、distribution shift robustness

它不为每个产品单独训练模型,也不依赖类别专属超参,而是用一套固定 pipeline 跑 MVTec AD 2 的 8 个工业类别。这个设定更贴近真实生产:产线不会给你充足异常样本,也不会允许每次换线都重新训练。

所以这篇的价值,不是单纯刷榜,而是把工业 AD 从“一类一训”推向“统一部署”。

CVPR 2026 | 根本不用训练!工业异常分割也能跨类别直接上产线!
SuperADD 方法总览图:展示 Train Images / Test Image 经过 Overlapped Patches、Frozen DINOv3、多层特征记忆库后生成 Anomaly Map 的流程

02 方法主线:大骨干提特征,记忆库做检索

SuperADD 继承了 SuperAD / PatchCore 的 memory bank 路线。

训练阶段不更新网络权重,只用正常样本抽取特征,构建正常特征库。测试时,将待检测图像的 patch 特征与 memory bank 做近邻匹配。距离越远,越可能是异常。

它使用 DINOv3‑ViT‑H+/16 作为视觉骨干,并抽取第 7、15、23、31 层特征。浅层看纹理和边缘,深层看结构和语义,多层融合能覆盖划痕、污渍、缺口、结构破损等不同缺陷形态。

这套方案很工程:不训练、不收敛、不做类别模型,用 foundation model 的通用表征能力,换部署侧的稳定性。

03 重叠切块:压住边界伪影

工业图像分辨率高,整图推理成本大;但直接切 patch,又容易在窗口边缘产生断裂和误检。

SuperADD 采用 overlapping patch‑wise inference,把图像切成带重叠区域的 patch,并保证 patch 与图像边界对齐,避免 padding 引入假特征。论文中设置 patch size 为 ,最小重叠为 

单维度 patch 数量计算

其中  是图像某一维度长度, 是 patch 尺寸, 是最小重叠宽度。

这个改动不花哨,但很实用。对 rice、walnuts、wallplugs 这类位置随机、遮挡复杂、实例堆叠的物体,重叠切块能减少网格伪影和边界漏检。

04 抗光照漂:先把变化打进正常库

MVTec AD 2 的难点不只是缺陷小,而是采集条件会变。尤其是光照漂移,会让同一个正常产品在特征空间里“看起来像异常”。

SuperADD 在正常样本特征提取前加入 intensity‑based augmentation,用随机强度缩放模拟曝光和光照变化。这样构建出来的正常特征库,不再只覆盖单一采集条件,而是覆盖更宽的正常外观分布。

阈值策略也更贴近真实上线。论文没有用测试集 GT 找最优阈值,而是从正常训练样本的 anomaly map 中估计阈值:取 95 分位数,再乘一个 gain factor。这样不需要异常标注,也避免了“测试集调参”的实验室味道。

05 后处理:把热力图变成可用 mask

工业检测不是只看热力图,最终还要落到缺陷面积、位置和形态统计。因此,异常 mask 是否连续、干净,非常关键。

SuperADD 在后处理阶段加入 iterative morphological closing,用多方向线性结构元素连接断裂区域,再通过 fill region 填补闭合孔洞,让细长划痕和边缘缺陷形成更完整的异常区域。

CVPR 2026 | 根本不用训练!工业异常分割也能跨类别直接上产线!
Post-processing 流程图:展示 Threshold、Morphological Closing、Logical AND、Fill Regions 的后处理链路

06 结果:统一参数下,平均 F1 最优

论文在 MVTec AD 2 上评估,包括 TESTpub、TESTpriv 和 TESTpriv,mix。核心指标是像素级 F1:

F1 分数

结果上,SuperADD 在 TESTpub 上达到 62.61% F1;在 TESTpriv 上达到 57.42% F1;在更难的 TESTpriv,mix 上达到 54.35% F1

表 1:TESTpub 各类别 AU-ROC0.05 与 F1 结果

CVPR 2026 | 根本不用训练!工业异常分割也能跨类别直接上产线!

更关键的是横向对比。表2 显示,SuperADD 在 TESTpriv / TESTpriv,mix 平均 F1 上达到 57.42 / 54.35,超过 PatchCore、EfficientAD、ISVL、RoBiS、ASEG、SuperAD 等方法。去年最强的 ISVL 为 53.81 / 51.43,说明 SuperADD 在分布偏移场景下更稳。

表 2:TESTpriv / TESTpriv,mix 方法对比

CVPR 2026 | 根本不用训练!工业异常分割也能跨类别直接上产线!

07 结语:工业 AD 开始卷鲁棒交付

SuperADD 不是最花哨的异常检测方法,但它的选题很务实。

当传统 MVTec AD 已经接近饱和,继续刷小数点后的提升意义有限。真正有价值的问题是:产品换了、光照变了、标注没有了,模型还能不能稳定交付?

SuperADD 给出的答案是:用强视觉骨干做通用表征,用记忆库保留正常分布,用重叠 patch 和后处理补工程细节,再用统一超参降低部署复杂度。

它的短板也清楚:DINOv3‑ViT‑H+/16 仍然偏重,极细微缺陷仍难检测,正常样本覆盖度也会影响 memory bank 质量。但从工业落地角度看,这条“免训练、跨类别、抗偏移”的路线值得继续跟。


雷峰网版权文章,未经授权禁止转载。详情见转载须知

CVPR 2026 | 根本不用训练!工业异常分割也能跨类别直接上产线!

分享:
相关文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说