您正在使用IE低版浏览器，为了您的雷峰网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器

热门标签强化学习

强化学习

本专题为雷峰网的强化学习专题，内容全部来自雷峰网精心选择与强化学习相关的最近资讯，雷峰网读懂智能与未来，拥有强化学习资讯的信息，在这里你能看到未来的世界。

强化学习最新资讯

人工智能

环境也能强化学习，智能体要找不着北了，UCL汪军团队提出环境设计的新方法

强化学习设计环境不仅高效，还能“利用人性的弱点”

杨晓凡
07月13日 23:40

人工智能强化学习汪军
人工智能

监督学习×强化学习，Facebook让聊天机器人学会谈判

通过监督学习+强化学习，这个聊天机器人不仅能理解字词和语义的对应关系，还能针对自己的目标跟别人进行协商讨论达成一致

杨晓凡
06月16日 09:38

FAIR 人工智能聊天机器人强化学习
人工智能开发者

One-Page AlphaGo --十分钟看懂 AlphaGo 的核心算法！

对《自然》发表的知名 AlphaGo 论文的要点总结。

三川
05月23日 16:42

强化学习 AlphaGo
人工智能

美国罗德岛大学杨庆教授：如何把机器学习技术应用于数据存储系统？ | CCF-ADL 火热报名中

作为计算机体系结构和数据存储方面的专家，杨庆教授近期将会在 CCF-ADL上为广大学术青年们带来他的技术研究进展。

谷磊
05月11日 13:15

机器学习强化学习深度学习杨庆
人工智能

南京大学俞扬博士：强化学习前沿（下）

本文根据俞扬博士在中国人工智能学会AIDL第二期人工智能前沿讲习班"机器学习前沿"所作报告《强化学习前沿》编辑整理而来，雷锋网在未改变原意的基础上略作了删减。

奕欣
05月15日 09:36

强化学习马尔可夫决策马尔可夫决策过程神经网络
人工智能

南京大学俞扬博士万字演讲全文：强化学习前沿（上）

本文根据俞扬博士在中国人工智能学会AIDL第二期人工智能前沿讲习班“机器学习前沿”所作报告《强化学习前沿》编辑整理而来，雷锋网在未改变原意的基础上略作了删减。

奕欣
05月09日 16:49

马尔可夫决策马尔可夫强化学习南京大学
人工智能

如何让强化学习采样变得更简单？剑桥大学联合谷歌伯克利提出 Q-Prop | ICLR 2017

研究人员提出了Q-Prop的方法，将on-policy和off-policy的优点结合起来，大大降低了强化学习方法的采样复杂度。

晟炜
04月26日 09:54

深度学习强化学习 Q-Prop
人工智能

玩转Atari能走迷宫，牛津大学的新型强化学习方法有多牛？ | ICLR 2017

通过使用这种共同学习的代表，基础智能体学习更快地优化外在回报，多数情况下，在培训结束时将会实现更好的策略。

哈帝•白求恩
04月20日 14:13

ICLR 2017 强化学习伪回报环境特征
人工智能

被微软收购后，Maluuba着手研究多重引导强化学习机

Maluuba初创公司致力于研究多重引导强化学习机，为机器学习再添领导能力。

sunshine_lady
04月13日 16:17

微软 Maluuba 强化学习领导能力
机器人

波士顿动力每出一款机器人你就说它要统治人类？还早着呢！

机器人涵盖的技术领域更广，波士顿动力只是在控制方面做出了逆天成绩。现在的机器人领域还有很多技术问题没有解决，所以我们暂时不可能造出科幻电影中的那种通用机器人

qqfly
03月02日 09:17

机器人 Atlas handle 波士顿动力

1...6 7 8910

相关文章

热门搜索

收购中科院比亚迪互联网金融 Model 3 tiktok 数字化转型陌陌 Galaxy S6 语音助手手机游戏

为了您的账户安全，请验证邮箱

您的邮箱还未验证,完成可获20积分哟！

重发邮箱修改邮箱

请验证您的邮箱

立即验证

完善账号信息

您的账号已经绑定，现在您可以设置密码以方便用邮箱登录

立即设置 以后再说