您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给黄善清
发送

0

腾讯 AI Lab 正式开源业内最大规模多标签图像数据集

本文作者:黄善清 2018-10-30 16:17
导语:本文将介绍「Tencent ML-Images」项目正式开源情况。
开发
企业:腾讯
操作:开源数据集
内容:多标签图像数据集

雷锋网AI科技评论按:10月18日,腾讯 AI Lab 宣布正式开源「Tencent ML-Images」项目,该项目由多标签图像数据集 ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络 ResNet-101 构成。

项目访问地址:

https://github.com/Tencent/tencent-ml-images

据雷锋网 AI 科技评论了解,腾讯 AI Lab 此次公布的图像数据集 ML-Images,包含了 1800 万图像和 1.1 万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以满足一般科研机构及中小企业的使用场景。此外,基于 ML-Images 训练得到的深度残差网络 ResNet-101,具有优异的视觉表示能力和泛化性能,在当前业内同类模型中精度最高,将为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。

本次正式开源,其主要内容包括:

  • ML-Images 数据集的全部图像 URLs, 以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯 AI Lab 提供的下载代码和 URLs 自行下载图像。

  • ML-Images 数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。

  • 完整的代码和模型。腾讯 AI Lab 提供的代码涵盖从图像下载和图像预处理,到基于 ML-Images 的预训练和基于 ImageNet 的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的 ResNet-101 模型 (在单标签基准数据集 ImageNet 的验证集上的 top-1 精度为 80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

雷峰网原创文章,未经授权禁止转载。详情见转载须知

腾讯 AI Lab 正式开源业内最大规模多标签图像数据集

分享:
相关文章
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说