CCF-GAIR 2020
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给雷锋字幕组
发送

0

DeepMind发布《星际争霸 II》深度学习环境 | 2分钟读论文

本文作者:雷锋字幕组 2017-09-27 17:35
导语:雷锋网AI 研习社出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

DeepMind发布《星际争霸 II》深度学习环境 | 2分钟读论文

雷锋网AI研习社【本期论文】

StarCraft II: A New Challenge for Reinforcement Learning

星际争霸 II:增强学习的新挑战

上个月,DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE(《星际争霸II 》学习环境)。

DeepMind发布《星际争霸 II》深度学习环境 | 2分钟读论文

论文描述《星际争霸II 》行动和奖励规范,并提供一个开源的Python界面,用于与游戏引擎进行通信。暴雪提供游戏输入输出的API,DeepMind又做了层基于Python的封装。

除了主要的游戏地图,他们提供了一套专注于《星际争霸II 》游戏不同元素的迷你游戏。对于主要的游戏地图,还提供了一个伴随专业玩家的游戏重播数据数据集。从该数据训练的神经网络的初始基线结果,预测游戏结果和玩家行为。

DeepMind发布《星际争霸 II》深度学习环境 | 2分钟读论文

文中使用了被称为Blizzard分数的一个中间分数,这个分数包含了一个对当前资源、等级以及单位和建筑的加权和,如果玩家赢得战斗而且管理好资源,这个分数就会单调增加,失败的时候,这个分数就会减少。此外,系统还使用了一系列的特征层为AI编码相关信息,比如地形高度、相机位置、屏幕中单位的血量以及各种其他信息。

最后,提出了应用于《星际争霸II 》的规范深强化学习的初始基线结果。DeepMind之后也会发布上百万帧的选手游戏记录,这对模拟环境研究也会有很大的帮助。

▷ 观看论文解读大概需要  6  分钟

学霸们还请自行阅读论文以获得更多细节

论文原址: https://arxiv.org/abs/1708.04782

Github: https://github.com/Blizzard/s2client 

雷锋网AI研习社出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。欢迎关注雷锋网(公众号:雷锋网)雷锋字幕组专栏,获得更多AI知识~感谢志愿者对本期内容作出贡献。

DeepMind发布《星际争霸 II》深度学习环境 | 2分钟读论文

雷锋网原创文章,未经授权禁止转载。详情见转载须知

DeepMind发布《星际争霸 II》深度学习环境 | 2分钟读论文

分享:
相关文章

文章点评:

表情

知情人士

入组微信leiphonefansub
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说