0
| 本文作者: 吴思梦 | 2026-05-29 11:40 | 专题:ICRA 国际机器人与自动化会议 |
原文作者:用户“多多的贾维斯”
原文链接:https://www.xiaohongshu.com/
KAN We Flow? Advancing Robotic Manipulation with 3D Flow Matching via KAN & RWKV

一、整体概述
1. 本文提出KAN-We-Flow,一种用于机器人三维操作的高效流匹配策略模型。
2. 核心贡献在于用RWKV与KAN替代传统大规模UNet骨干,在保持甚至提升成功率的同时,大幅降低参数量与推理延迟。
3. 方法在Adroit、Meta-World、DexArt三大基准上取得当前最优或并列最优性能,参数量减少约86.8%,支持实时控制。

二、研究背景
1、扩散式策略
① 优点是动作分布建模能力强
② 缺点是需要多步去噪,推理慢、模型重,不利于真实机器人部署
2、流匹配策略
① 通过学习一步向量场实现快速生成
② 但现有方法仍大量依赖UNet,计算与存储开销依旧偏大
3、核心问题
如何在保证精度的前提下,进一步压缩模型规模并提升实时性

三、动机直觉
1、RWKV具备线性复杂度的时序建模能力,适合长时序动作预测
2、KAN基于可学习的一维函数逼近,能以更少参数表达复杂非线性映射
3、将二者结合,有望同时解决“长时序依赖”和“参数效率”问题

四、技术路线
1、整体框架
① 采用一致性流匹配,实现一步动作生成
② 输入为点云感知、机器人状态与时间编码
2、核心网络
① RWKV-KAN骨干网络
* RWKV负责时间与通道混合,建模动作序列上下文
* GroupKAN对特征通道进行分组的非线性函数校准,替代传统MLP
② Action Consistency Regularization(ACR)
* 通过欧拉外推,将一步预测动作与专家轨迹在末端对齐
* 提供额外监督,稳定训练,不增加推理成本
3、学习目标
联合一致性流匹配损失与ACR正则项进行端到端训练

五、实验结果
1、性能表现
① 在Adroit、Meta-World、DexArt上整体成功率优于FlowPolicy与DP3
② 在高难度、长时序任务中优势更明显
2、效率对比
① 参数量约33.6M,相比DP3减少86.8%
② 推理时间约8–11ms,满足100Hz实时控制
3、消融实验
① RWKV、GroupKAN与ACR均对性能有稳定增益
② ACR在长预测窗口下显著降低动作漂移
雷峰网(公众号:雷峰网)