您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能学术 正文
发私信给AI研习社
发送

0

【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

本文作者:AI研习社 2019-12-02 19:30
导语:字幕君带着获得了加州大学伯克利分校 CS285 《深度强化学习》讲师@Sergey Levine正式授权汉化翻译,感兴趣的同学也可以报名参与志愿者翻译团队。

语音播放文章内容

由深声科技提供技术支持

他来了他来了,字幕君带着新课的授权来了!

【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

在这2019年的尾声,字幕君带着获得了加州大学伯克利分校 CS285 《深度强化学习》讲师@Sergey Levine正式授权汉化翻译,感兴趣的同学也可以报名参与志愿者翻译团队。

【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

添加字幕君微信,备注“285翻译”报名加入翻译

字幕君深知一人坚持的不易,并想邀请热爱学习的你和诸多志同道合的小伙伴,以相互监督,共同进步的形式,一起研习这门新课程!


 加入学习小组

进入2019 UC 伯克利 CS285 深度强化学习小组即可视为成功报名!

直达链接:https://www.yanxishe.com/overseasCourse/103?from=leiphonecolumn

加入小组后获得2019 UC 伯克利 CS285 《深度强化学习》课件 PPT下载地址


 学习形式

1. 课程视频更新后,学员需要观看课程视频并且在社区留言打卡; 

2. 每学完一节课程,学员需在自行独立完成 Quiz 作业并在社区博客进行分享 

3. 学员可以根据自己的时间及兴趣,决定是否进行课后作业分享的公开课直播。 

4. 为保证社区的学习氛围,社长会根据课程完成情况和活跃程度对学员进行监督管理,如有必要,会定期清理不活跃或者长期潜水的学员;    

5. 课程结束后,优秀的学员可以获得社区提供的福利以及礼品;  

6. 社区翻译志愿者持续招募中,如果对这门课程的翻译感兴趣,可以联系社长准备字幕翻译工作。

7. 课程有一定难度,且有较多作业,希望学员一旦加入,能够克服困难,收获成长。

 课程介绍

众所周知,深度强化学习是人工智能发展的重大方向之一。熟悉深度强化学习背景知识的优秀人才倍受各大科研机构与公司青睐,不管是工业界还是学术界,深度强化学习都被视为实现通用人工智能最有可能的路径之一。因此,熟悉深度强化学习知识显得尤为重要。

在CS285这门课程中,Sergey Levine 教授将会深入浅出地讲解深度强化学习的背景理论知识、实现方式以及核心算法,并布置相应的家庭作业以帮助各位同学更好地巩固学习内容。

这次课程,一共有 21 讲,具体如下:

【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

 课件截图

【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募
【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募
【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

 学生评价

首先这门课的质量非常好。课程反应了Sergey Levine和整伯克利RL的积累,独立于《RL Introduction》的教学体系自成一派。最可贵的是涵盖近1-2年RL最前沿的知识。这门课又难又深,但绝对是飞往RL前沿的航班。研究RL的同学万万不可错过啊。

By 知乎答主“有道理”

现在强烈推荐这门课程!课程基本可以分为DRL介绍+模仿学习、model free、model based、Exploration+迁移+多任务+Meta-learning等四大部分,一共有四个很有趣的assignment(比春季的更好了)。如果你看过david silver的视频并且有机器学习的基础,那么至少你在model free部分是没问题的。秋季课程其实降低了对RL基础的要求,课上推导过程比较清晰。这门课后半model based部分恰好是对david silver等当前已有的课程、书籍里讲的比较少的内容的非常大的补充,不过这部分要求比较高。

By 知乎答主“糖葫芦喵喵”


 课程大纲

第一讲:课程介绍和概览

第二讲:针对行为的监督学习

第三讲:TensorFlow 和神经网络简述

第四讲:强化学习简介

第五讲:策略梯度

第六讲:Actor-Critic 算法

第七讲:价值函数

第八讲:深度强化学习之Q函数

第九讲:高级策略梯度

第十讲:基于模型的规划

第十一讲:基于模型的强化学习

第十二讲:基于模型的策略学习

第十三讲:变分推断和生成模型

第十四讲:强化学习对控制的概率推断

第十五讲:逆向强化学习

第十六讲:迁移学习与多任务学习

第十七讲:分布式强化学习

第十八讲:探索(上)

第十九讲:探索(下)

第二十讲:元学习

第二十一讲:信息理论,开放性问题探讨


雷锋网雷锋网雷锋网


雷峰网原创文章,未经授权禁止转载。详情见转载须知

【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

分享:
相关文章

编辑

聚焦数据科学,连接 AI 开发者。更多精彩内容,请访问:yanxishe.com
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说