您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
人工智能 正文
发私信给汪思颖
发送

0

商汤科技正式开源 mmdetection 和 mmcv

本文作者:汪思颖 2018-10-14 13:37
导语:mmdetection 和 Detectron 主要有如下三点差异:performance 稍高;训练速度稍快;所需显存稍小。
开发
企业:商汤科技SenseTime
操作:开源
内容:开源mmcv

雷锋网(公众号:雷锋网) AI 科技评论消息,10 月 12 日,商汤科技正式开源 mmdetection 和 mmcv 两个项目。凭借以上事件,商汤科技在雷锋网旗下学术频道 AI 科技评论数据库产品「AI 影响因子」上有相应加分。

据悉,mmdetection 检测库是基于商汤在 COCO 比赛(Detection 2018 winner)时的 codebase 重构,这个开源库提供了已公开发表的多种视觉检测核心模块,通过这些模块的组合,可以迅速搭建出各种著名的检测框架。据该开源库作者之一、香港中文大学陈恺介绍,这一版本中实现了 RPN,Fast R-CNN,Faster R-CNN,Mask R-CNN,近期还计划释放 RetinaNet 和 Cascade R-CNN。

mmcv 是一个基础库,主要分为两个部分,一部分是和 deep learning framework 无关的一些工具函数,比如 IO/Image/Video 相关的一些操作,另一部分是为 PyTorch 写的一套训练工具,可以大大减少用户需要写的代码量,同时让整个流程的定制变得容易。

在该库开源之后,知乎上有人提出问题:

如何评价商汤开源的 mm-detection 检测库?mm-detection 相比 FAIR 的 Detectron 如何?

陈恺也第一时间进行解答,他表示,mmdetection 和 Detectron 主要有如下三点差异:

  1. performance 稍高

  2. 训练速度稍快

  3. 所需显存稍小

他进一步解释道,在 performance 上 ,由于 PyTorch 官方 model zoo 里的 ResNet 结构和 Detectron 所用的 ResNet 有细微差别(mmdetection 中可以通过 backbone 的 style 参数指定),导致模型收敛速度不一样。他们用两种结构都进行了实验,和 Detectron 使用相同的 pretrain model 的情况下,performance 比 Detectron 稍高,在使用 PyTorch 官方的 model 进行训练时, 1x 的 lr schedule 下比 Detectron 的 performance 略低,但 2x 的情况下更高。

速度方面 Mask R-CNN 的差异比较大,其余框架的差异很小。采用相同的 setting,Detectron 每个 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。Fast R-CNN 比较例外,比 Detectron 的速度稍慢。另外,他们在服务器上跑 Detectron 会比官方 report 的速度慢 20% 左右,他提出猜测,可能是 FB 的 Big Basin 服务器性能比他们好。

在显存方面这一检测库的优势比较明显,会小 30% 左右。但他表示,这和框架有关,不完全是 codebase 优化的功劳。一个让他们比较意外的结果是,现在的 codebase 版本跑 ResNet-50 的 Mask R-CNN,每张卡(12 G)可以放 4 张图,显存消耗比他们在 COCO 比赛时小了不少。

雷锋网版权文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介