ICRA 2026｜KAN We Flow?（机器人控制）

本文作者：吴思梦

2026-05-29 11:40

专题：ICRA 国际机器人与自动化会议

导语：如何在保证精度的前提下，进一步压缩模型规模并提升实时性

原文作者：用户“多多的贾维斯”

原文链接：https://www.xiaohongshu.com/

KAN We Flow? Advancing Robotic Manipulation with 3D Flow Matching via KAN & RWKV

ICRA 2026｜KAN We Flow?（机器人控制）

一、整体概述

1. 本文提出KAN-We-Flow，一种用于机器人三维操作的高效流匹配策略模型。

2. 核心贡献在于用RWKV与KAN替代传统大规模UNet骨干，在保持甚至提升成功率的同时，大幅降低参数量与推理延迟。

3. 方法在Adroit、Meta-World、DexArt三大基准上取得当前最优或并列最优性能，参数量减少约86.8%，支持实时控制。

ICRA 2026｜KAN We Flow?（机器人控制）

二、研究背景

1、扩散式策略

① 优点是动作分布建模能力强

② 缺点是需要多步去噪，推理慢、模型重，不利于真实机器人部署

2、流匹配策略

① 通过学习一步向量场实现快速生成

② 但现有方法仍大量依赖UNet，计算与存储开销依旧偏大

3、核心问题

如何在保证精度的前提下，进一步压缩模型规模并提升实时性

ICRA 2026｜KAN We Flow?（机器人控制）

三、动机直觉

1、RWKV具备线性复杂度的时序建模能力，适合长时序动作预测

2、KAN基于可学习的一维函数逼近，能以更少参数表达复杂非线性映射

3、将二者结合，有望同时解决“长时序依赖”和“参数效率”问题

ICRA 2026｜KAN We Flow?（机器人控制）

四、技术路线

1、整体框架

① 采用一致性流匹配，实现一步动作生成

② 输入为点云感知、机器人状态与时间编码

2、核心网络

① RWKV-KAN骨干网络

* RWKV负责时间与通道混合，建模动作序列上下文

* GroupKAN对特征通道进行分组的非线性函数校准，替代传统MLP

② Action Consistency Regularization（ACR）

* 通过欧拉外推，将一步预测动作与专家轨迹在末端对齐

* 提供额外监督，稳定训练，不增加推理成本

3、学习目标

联合一致性流匹配损失与ACR正则项进行端到端训练

ICRA 2026｜KAN We Flow?（机器人控制）

五、实验结果

1、性能表现

① 在Adroit、Meta-World、DexArt上整体成功率优于FlowPolicy与DP3

② 在高难度、长时序任务中优势更明显

2、效率对比

① 参数量约33.6M，相比DP3减少86.8%

② 推理时间约8–11ms，满足100Hz实时控制

3、消融实验

① RWKV、GroupKAN与ACR均对性能有稳定增益

② ACR在长预测窗口下显著降低动作漂移

雷峰网(公众号：雷峰网)

0人收藏

专题

ICRA 国际机器人与自动化会议

本专题其他文章

吴思梦

编辑

发私信

当月热门文章