您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷峰网公开课
活动中心
GAIR
专题
爱搞机
业界
人工智能
学术
开发者
智能驾驶
数智化
零售数智化
金融数智化
工业数智化
医疗数智化
城市数智化
金融科技
科技巨头
银行AI
金融云
风控与安全
//= baseUrl()?>
医疗科技
医疗AI
投融资
医疗器械
互联网医疗
生物医药
健康险
芯片
政企安全
智慧城市
智慧安防
智慧教育
智慧交通
智慧社区
智慧零售
智慧政务
智慧地产
行业云
工业互联网
工业软件
工业安全
5G工业互联网
工业转型实践
AIoT
物联网
智能硬件
机器人
智能家居
热门标签
强化学习
强化学习
本专题为雷峰网的
强化学习
专题,内容全部来自雷峰网精心选择与
强化学习
相关的最近资讯,雷峰网读懂智能与未来,拥有
强化学习
资讯的信息,在这里你能看到未来的世界。
详解Facebook田渊栋NIPS2017论文:让大家都能做得起深度强化学习研究的ELF平台
从概念到应用,全面了解强化学习
开发者自述:我是这样理解强化学习的
强化学习最新资讯
人工智能
环境也能强化学习,智能体要找不着北了,UCL汪军团队提出环境设计的新方法
强化学习设计环境不仅高效,还能“利用人性的弱点”
杨晓凡
07月13日 23:40
人工智能
强化学习
汪军
人工智能
监督学习×强化学习,Facebook让聊天机器人学会谈判
通过监督学习+强化学习,这个聊天机器人不仅能理解字词和语义的对应关系,还能针对自己的目标跟别人进行协商讨论达成一致
杨晓凡
06月16日 09:38
FAIR
人工智能
聊天机器人
强化学习
人工智能开发者
One-Page AlphaGo --十分钟看懂 AlphaGo 的核心算法!
对《自然》发表的知名 AlphaGo 论文的要点总结。
三川
05月23日 16:42
强化学习
AlphaGo
人工智能
美国罗德岛大学杨庆教授:如何把机器学习技术应用于数据存储系统? | CCF-ADL 火热报名中
作为计算机体系结构和数据存储方面的专家,杨庆教授近期将会在 CCF-ADL上为广大学术青年们带来他的技术研究进展。
谷磊
05月11日 13:15
机器学习
强化学习
深度学习
杨庆
人工智能
南京大学俞扬博士:强化学习前沿(下)
本文根据俞扬博士在中国人工智能学会AIDL第二期人工智能前沿讲习班"机器学习前沿"所作报告《强化学习前沿》编辑整理而来,雷锋网在未改变原意的基础上略作了删减。
奕欣
05月15日 09:36
强化学习
马尔可夫决策
马尔可夫决策过程
神经网络
人工智能
南京大学俞扬博士万字演讲全文:强化学习前沿(上)
本文根据俞扬博士在中国人工智能学会AIDL第二期人工智能前沿讲习班“机器学习前沿”所作报告《强化学习前沿》编辑整理而来,雷锋网在未改变原意的基础上略作了删减。
奕欣
05月09日 16:49
马尔可夫决策
马尔可夫
强化学习
南京大学
人工智能
如何让强化学习采样变得更简单?剑桥大学联合谷歌伯克利提出 Q-Prop | ICLR 2017
研究人员提出了Q-Prop的方法,将on-policy和off-policy的优点结合起来,大大降低了强化学习方法的采样复杂度。
晟炜
04月26日 09:54
深度学习
强化学习
Q-Prop
人工智能
玩转Atari能走迷宫,牛津大学的新型强化学习方法有多牛? | ICLR 2017
通过使用这种共同学习的代表,基础智能体学习更快地优化外在回报,多数情况下,在培训结束时将会实现更好的策略。
哈帝•白求恩
04月20日 14:13
ICLR 2017
强化学习
伪回报
环境特征
人工智能
被微软收购后,Maluuba着手研究多重引导强化学习机
Maluuba初创公司致力于研究多重引导强化学习机,为机器学习再添领导能力。
sunshine_lady
04月13日 16:17
微软
Maluuba
强化学习
领导能力
机器人
波士顿动力每出一款机器人你就说它要统治人类?还早着呢!
机器人涵盖的技术领域更广,波士顿动力只是在控制方面做出了逆天成绩。现在的机器人领域还有很多技术问题没有解决,所以我们暂时不可能造出科幻电影中的那种通用机器人
qqfly
03月02日 09:17
机器人
Atlas
handle
波士顿动力
1
...
6
7
8
9
10
相关文章
如何让强化学习采样变得更简单?剑桥大学联合谷歌伯克利提出 Q-Prop | ICLR 2017
玩转Atari能走迷宫,牛津大学的新型强化学习方法有多牛? | ICLR 2017
被微软收购后,Maluuba着手研究多重引导强化学习机
波士顿动力每出一款机器人你就说它要统治人类?还早着呢!
28天自制你的AlphaGo(四):结合强化学习与深度学习的Policy Gradient(左右互搏自我进化的基础)
热门搜索
收购
中科院
比亚迪
互联网金融
Model 3
tiktok
数字化转型
陌陌
Galaxy S6
语音助手
手机游戏
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请
验证邮箱
您的邮箱还未验证,完成可获20积分哟!
重发邮箱
修改邮箱
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以
设置密码
以方便用邮箱登录
立即设置
以后再说