0
| 本文作者: 陈淑瑜 | 2026-05-29 16:23 | 专题:CVPR 计算机视觉与模式识别会议 |
来源:公众号“CV实验室”
原文链接:https://mp.weixin.qq.com/s/65JSJhgEB_O_2epsG0pfIw?scene=1&click_id=51
在计算机视觉领域,目标追踪(Visual Tracking)一直需要在“高精度”和“低功耗”之间寻找平衡。SNN(脉冲神经网络)因其生物仿真特性和极高的能源效率被寄予厚望,但在处理复杂的RGB视觉追踪任务时,往往难以兼顾精度。
今天介绍的这篇 CVPR 2026 论文 SpikeTrack,提出了一种全新的全脉冲驱动框架。它不仅在SNN追踪器中达到了SOTA(目前最佳)水平,更在保证精度的前提下,将能耗降低至传统ANN追踪器的几十分之一。

论文标题: SpikeTrack: A Spike-driven Framework for Efficient Visual Tracking
论文链接: https://arxiv.org/pdf/2602.23963
代码仓库: https://github.com/faicaiwawa/SpikeTrack (已开源)
现有的SNN追踪框架主要面临两个问题:
SpikeTrack 的解决方案:非对称孪生架构
作者没有照搬ANN的交互模式,而是设计了一种非对称(Asymmetric)的设计:

SpikeTrack 的架构主要由三个部分组成:共享权重的脉冲主干网络(Backbone)、用于信息交互的记忆检索模块(MRM)、以及预测头。

为了保证真正的脉冲驱动,论文采用了 NI-LIF (Normalized Integer Leaky Integrate-and-Fire) 神经元。它在推理时将膜电位转换为整数脉冲,实现了稀疏的加法计算,替代了高能耗的浮点乘法。
其动力学方程如下:
其中, 是膜电位, 是输出脉冲, 是可学习的衰减因子。可学习的衰减因子允许网络自适应地调节对历史信息的遗忘程度。
这是SpikeTrack最核心的创新点。为了实现“模板”到“搜索”的高效信息传递,作者借鉴了大脑皮层(V1 L2/3区域)的神经推理机制:通过循环连接(Recurrent Connectivity)来完善感知。
在SpikeTrack中,模板特征被初始化为“记忆库(Memory Bank)”。搜索分支在推理时,并不直接与模板拼接,而是通过MRM模块去“查询”记忆库,逐步提取目标线索。
MRM 的工作流程包含三个阶段的循环(Recurrent Process):

最终,通过多次循环检索(实验中1次循环效果最佳),搜索分支能精准地“想起来”目标长什么样,并定位目标。
在LaSOT数据集上,SpikeTrack展现了惊人的能效比。

MRM模块到底学到了什么?可视化结果显示,随着层级加深,网络能够从通过检索记忆库,在复杂的遮挡、背景干扰下,逐渐聚焦于目标物体。

SpikeTrack 的成功证明了 SNN 在复杂视觉任务中的潜力。其核心贡献在于跳出了“一味模仿 ANN 架构”的误区,结合了 SNN 特有的时空计算特性:
这项工作不仅刷新了 SNN 追踪的 SOTA,也为在极低功耗设备(如微型无人机、边缘计算芯片)上部署高精度视觉追踪算法提供了切实可行的方案。
本专题其他文章