全球AIoT产业·智能制造峰会
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
AI+ 正文
发私信给AI研习社
发送

0

大讲堂 | 强化学习的鲁棒性问题

本文作者:AI研习社 编辑:杨强 2019-10-10 14:24
导语:本次公开课中,讲者将介绍华为伦敦研究所决策与推理团队在鲁棒强化学习方面的相关工作。

语音播放文章内容

由深声科技提供技术支持

分享主题

鲁棒强化学习

 

分享背景

强化学习算法依赖大量采样的特性决定了需要首先在仿真环境中训练智能体策略再迁移到现实系统中。因此当仿真环境和现实系统出现不匹配时,策略的鲁棒性是影响强化学习算法能否实用的关键因素。本次公开课中,讲者将介绍华为伦敦研究所决策与推理团队在鲁棒强化学习方面的相关工作。


分享嘉宾

任航,伦敦帝国理工学院博士,任职于华为诺亚方舟实验室伦敦


分享提纲

  • 华为伦敦研究所决策与推理团队介绍

  • 强化学习的相关背景知识与强化学习的鲁棒性问题

  • Wasserstein Robust Reinforcement Learning 论文解读

 

分享时间

(北京时间 )  10月 10 日(星期四)  20:00

大讲堂 | 强化学习的鲁棒性问题

雷锋网雷锋网(公众号:雷锋网)雷锋网

雷锋网原创文章,未经授权禁止转载。详情见转载须知

大讲堂 | 强化学习的鲁棒性问题

分享:
相关文章

文章点评:

表情
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说