ICRA的4篇机器视觉论文大盘点 | ICRA 2017

本文作者：隔壁王大喵

编辑：郭奕欣

2017-05-25 20:40

专题：ICRA 2017：创新、创业和解决方法

导语：ICRA的最佳4篇机器视觉论文大盘点新鲜出炉啦！

雷锋网AI科技评论按：ICRA全称为“IEEE International Conference on Robotics and Automation”（机器人与自动化会议），是机器人技术领域最有影响力的国际学术会议之一。ICRA 2017于5月29日至6月4日举行，雷锋网AI科技评论将从新加坡带来一线报道。该会议举办期间，雷锋网将围绕会议议程及获奖论文展开系列专题报道，敬请期待。

ICRA的4篇机器视觉论文大盘点 | ICRA 2017

论文一：《Self-supervised Learning of Dense Visual Descriptors》

论文作者：Schmidt, Tanner; Newcombe, Richard; Fox, Dieter

作者主页：http://homes.cs.washington.edu/~tws10/

相关机构：华盛顿大学

论文摘要：

图像像素间对应关系的鲁棒性估计是机器人技术中一个重要的问题。它被应用于对象、环境和其它代理的跟踪、映射与识别任务中。对应评估（Correspondence estimation）长期以来都是属于手工特征工程的领域。但是，最近深度学习技术为从原始数据中学习特征的任务提供了强大的工具。不过深度学习的缺点就是需要大量的（通常需要带有标签）训练数据来支持训练学习过程。据雷锋网了解，该论文提出了一种学习密集图像对应任务（Dense image correspondences）的新方法，其中研究员们利用强大的3D生成模型来实现程序自动标记视频数据中的对应关系。论文中使用了对比损失来训练完全卷积神经网络，以生成视点和照明不变的特征。

作为一个概念证明，研究员收集了两个数据集：第一个数据集描绘了一个人在各种各样的环境当中，但是视频的主体始终是这个人的上身与头部；第二个则描绘了许多天内的同一间办公室，而不同时间内办公室物体摆放方式不同。据悉，该数据集专注于重新访问相同的对象和环境，并且论文也表明了，仅通过本地跟踪数据（Local tracking data）训练CNN，所学习到的视觉描述符能够分辨出无标签视频间的对应关系。

论文链接：https://ieeexplore.ieee.org/document/7762851/

论文二：《Probabilistic Articulated Real-Time Tracking for Robot Manipulation》

论文作者：Garcia Cifuentes, Cristina; Issac, Jan; Wüthrich, Manuel; Schaal, Stefan; Bohg, Jeannette

作者主页：http://am.is.tue.mpg.de/people/ccifuentes

相关机构：德国斯图加特的研究所

论文摘要：

据雷锋网了解，该论文提出了一种概率滤波方法（Probabilistic filtering method），它将联合测量（Joint measurements）与深度图像（Depth images）融合，以产生相机框架中末端执行器姿态（End-effector pose）的准确且实时的估计。在组合使用框架与视觉对象跟踪的时候，这样做可以避免框架转换。另外本文中通过对联合测量中的偏差进行建模和校正，以及机器人模型中的不准确性（比如较差的外置相机校准）来提高精度。

ICRA的4篇机器视觉论文大盘点 | ICRA 2017

该论文的研究员通过基于坐标粒子滤波器（Coordinate Particle Filter）的异步深度图像更新和联合测量的卡尔曼滤波器（Kalman filtering）的原则组合，使得算法在计算效率上更加高效。该论文还在一个自主构建的数据集上定量评估算法，该数据集采集自一个真实的机器人平台，并且通过运动捕捉系统标注了真实数据（Ground truth）。实验还表明了，即使在诸如快速运动（Fast motion）、显著和长期闭塞（Significant and long-term occlusions）以及时变偏差等（Time-varying biases）挑战性条件下，该算法也具有稳健性和准确性。另外，为了方便其它研究员进行定量比较，该论文作者还将数据集和算法代码开放了出来。

论文链接：https://arxiv.org/abs/1610.04871