0
| 本文作者: 陈淑瑜 | 2026-05-27 18:49 | 专题:ICRA 国际机器人与自动化会议 |
来源:公众号“labren”
原文链接:https://mp.weixin.qq.com/s/97_CzzOnRfXvVUV_q30wKQ?scene=1
香港中文大学任洪亮教授团队论文《EndoDDC:通过扩散深度补全学习稀疏到密集重建用于内窥镜机器人导航》被机器人领域顶会 IEEE International Conference on Robotics and Automation (ICRA 2026) 录用!

论文题目:EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion
论文作者:林胤恒†(香港中文大学),黄一鸣†(香港中文大学),崔贝雷(香港中文大学), 白龙(阿里巴巴达摩院,香港中文大学), 高沪昕(香港中文大学),任洪亮(香港中文大学), 赖捷文*(香港中文大学)
论文简介:
在微创外科手术中,内镜机器人的精准导航是提升手术精度、保障患者安全的核心。而精准导航的关键,在于获取可靠的三维深度信息 —— 但内镜环境下的弱纹理组织、镜面反射等问题,一直让深度估计成为技术难题。现有方法要么依赖难以获取的稠密标注数据,要么在复杂内镜场景中鲁棒性不足,稀疏深度重建的有效性大打折扣。
我们提出的EndoDDC方法,为内镜机器人导航的深度估计难题提供了创新解决方案。该方法通过融合图像、稀疏深度信息与深度梯度特征,借助扩散模型优化深度图,成功攻克弱纹理、光反射带来的技术痛点。
主要贡献:
EndoDDC针对内镜场景量身设计稀疏到稠密重建框架,有效解决传统微调方法对标注数据的依赖,以及自监督学习的尺度模糊问题,仅通过 RGB 图像和稀疏深度图即可输出精准稠密深度图。
创新引入深度梯度融合模块,通过卷积门控循环单元(ConvGRU)迭代处理深度值与梯度信息,为重建过程提供精准几何引导,大幅提升弱纹理区域的重建精度。
提出基于深度梯度的条件扩散模型,以初始粗深度图为起点,利用深度梯度特征约束去噪过程,迭代优化深度值,确保重建结果的全局一致性与物理合理性。
在 C3VD 和 StereoMIS 两大公开内镜数据集上完成全面验证,所有评估指标(RMSE、MAE、REL、δ 准确率)均超越当前 SOTA 方法。相较于最优深度补全模型 OGNI-DC,C3VD 数据集上 RMSE 降低 5.28%、MAE 降低 7.84%;即使面对 50~50000 不同稀疏度的输入,仍能稳定输出高质量稠密深度图。

EndoDDC方法概览和可视化样例

EndoDDC 概述:在从 RGB 图像和稀疏深度图提取特征后,Depth Grad Fusion 模块会基于深度和梯度特征迭代地更新状态隐藏网络。然后,将该输出输入到 Depth Diffusion 模型进行条件引导下的补全。

在 C3VD 和 STEREOMIS 数据集上与SOTA方法的深度补全结果比较。

在 C3VD 和 StereoMIS 数据集上的比较。我们将 EndoDDC 与最先进的深度估计和深度补全方法进行比较;我们的方法在组织细节方面产生的误差更少。
参考文献:
Lin, Y., Huang, Y., Cui, B., Bai, L., Gao, H., Ren, H. & Lai, J. (2026). EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion. ICRA 2026.
雷峰网版权文章,未经授权禁止转载。详情见转载须知。