智能驾驶峰会
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
AI开发 正文
发私信给汪思颖
发送

0

OpenAI 启动迁移学习比赛,一起来玩刺猬索尼克游戏吧

本文作者:汪思颖 2018-04-06 13:41
导语:OpenAI 启动一项迁移学习比赛,参赛者需要让智能体来玩风靡一时的 Sonic The Hedgehog(刺猬索尼克)游戏,目前时间轴和规则已经公布。

雷锋网 AI 研习社按:日前,OpenAI 启动一项迁移学习比赛,这一比赛为期两个月(4 月 5 日-6 月 5 日),参赛者需要让智能体来玩风靡一时的 Sonic The Hedgehog(刺猬索尼克)游戏。这一比赛将会评出三大奖项,参赛者有机会获得丰厚奖励,并与 OpenAI 共同撰写比赛技术文档。

OpenAI 启动迁移学习比赛,一起来玩刺猬索尼克游戏吧

雷锋网(公众号:雷锋网) AI 研习社将在下文介绍关于比赛的详细信息。

在 OpenAI 官网可以看到,这次比赛将会衡量强化学习算法基于以往经验的泛化能力。“在典型的强化学习研究中,算法是在相同环境下进行训练的,这使得算法擅长记忆,并有很多超参数。此次竞赛将会在电子游戏关卡中测试算法——参赛选手需要让智能体玩 Sonic The Hedgehog(刺猬索尼克)游戏,用于测试的游戏关卡此前从没出现过。

此次比赛基于 Gym Retro 平台。此外,为了助于大家比赛,OpenAI 也开源 retro-baselines,这一工具展示了如何在比赛任务中运行多个强化学习算法。比赛为期两个月(4 月 5 日-6 月 5 日),获胜者将得到一些很棒的奖品。

以下是参赛详情:

  • 参赛者训练智能体(或者编写脚本)来玩 Sonic The Hedgehog 游戏;

  • 参赛者将智能体打包到 Docker 容器提交;

  • OpenAI 对提交的智能体进行一套秘密测试;

  • 排行榜上会出现智能体的得分情况。

下面的图解对这个过程进行了详细说明。

OpenAI 启动迁移学习比赛,一起来玩刺猬索尼克游戏吧

OpenAI 表示,强化学习的下一步是利用以往经验快速在新环境中学习。目前的算法很容易记忆,但不能很好地适应新的情况。虽然这次比赛的重点是电子游戏,但他们希望获胜的技术能适用于更广泛的领域。

比赛规则如下:

  • 一个团队只能用一个帐户;

  • 可以与其他团队分享短代码片段或指导代码,但不能分享完整或部分解决方案;

  • 参赛选手只能隶属于一个团队。

下面是对「最佳成绩奖」(Best Score)和「最佳代码奖」(Best Writeup)的介绍。要想争夺这两类奖项,参赛者必须在比赛最后阶段将自己提交的智能体开源。每类奖项的前三名都将获得奖励。

此外,还有额外的「最佳支持奖」(Best Supporting Materials)。

所有获奖者将受邀与 OpenAI 一起完成这一比赛的技术报告。

比赛规则页面:https://contest.openai.com/details

Leaderboard 页面:https://contest.openai.com/leaderboard

Benchmark 详细描述:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-contest/gotta_learn_fast_report.pdf

雷锋网 AI 研习社编译整理。

via:https://contest.openai.com

雷锋网版权文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介