您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
AI研习社
雷峰网公开课
活动中心
GAIR
专题
爱搞机
业界
人工智能
学术
开发者
智能驾驶
数智化
零售数智化
金融数智化
工业数智化
医疗数智化
城市数智化
金融科技
科技巨头
银行AI
金融云
风控与安全
//= baseUrl()?>
医疗科技
医疗AI
投融资
医疗器械
互联网医疗
生物医药
健康险
芯片
政企安全
智慧城市
智慧安防
智慧教育
智慧交通
智慧社区
智慧零售
智慧政务
智慧地产
行业云
工业互联网
工业软件
工业安全
5G工业互联网
工业转型实践
AIoT
物联网
智能硬件
机器人
智能家居
热门标签
强化学习
强化学习
本专题为雷峰网的
强化学习
专题,内容全部来自雷峰网精心选择与
强化学习
相关的最近资讯,雷峰网读懂智能与未来,拥有
强化学习
资讯的信息,在这里你能看到未来的世界。
要更有钱、更烧钱,OpenAI 重组,加速融资之路
强化学习怎样在探索和利用之间找到平衡?OpenAI 推出了大型多智能体游戏环境 Neural MMO
怎么把GPU上训练的模型转到TPU或者CPU上去?DeepMind发布新工具支招
强化学习最新资讯
专栏
简单易懂------强化学习理论与实战(一)
本系列文章通过通俗易懂的方式介绍强化学习的基本概念,虽然语言通俗,但是内容依旧非常严谨性。
宗仁
03月05日 17:25
深度学习
强化学习
Reinforcement Learning
强化学习实战
人工智能学术
和谷歌一同探索基于强化学习的长距离机器人导航
好的强化学习方法可以大幅改善鲁棒性
杨晓凡
03月12日 19:05
谷歌
人工智能
强化学习
机器人
人工智能
强化学习中,如何从稀疏和不明确的反馈中学习泛化
谷歌 AI 新发布的博文
skura
03月02日 10:11
谷歌AI
强化学习
稀疏反馈
泛化
人工智能
谷歌开源强化学习深度规划网络 PlaNet
创建出足够准确用于进行规划的模型,一直是强化学习的长期目标。
黄善清
02月18日 18:26
强化学习
智能体
人工智能
DeepMind
人工智能
围棋 AI ELF OpenGo 迎来更新,另有田渊栋呈上开源项目的详细解读
并一同发布了新的研究成果以及可在 Windows 上运行的机器人版本。
丛末
02月15日 09:54
facebook
围棋机器人
强化学习
深度学习
人工智能
2019 年 1 月 AI 最佳网文榜单最新出炉!
榜单中的文章主题涵盖强化学习、自然语言处理、人工智能立法等。
丛末
02月09日 11:01
人工智能
深度学习
强化学习
自然语言处理
人工智能学术
AAAI 2019 四个杰出论文奖论文揭晓
一半都是强化学习论文
杨晓凡
01月29日 15:40
AAAI
人工智能
强化学习
深度学习
人工智能
强化学习基础 - 共轭梯度
我们可以使用共轭梯度法(conjugate gradient)解线性方程或优化二次方程。
AI研习社-译站
01月28日 11:09
强化学习
机器学习
人工智能
强化学习基础-对偶梯度上升
对偶梯度下降是一个优化带约束目标函数的常用方法。
AI研习社-译站
01月28日 10:26
强化学习
机器学习
人工智能
多图详解 DeepMind 的超人类水准星际争霸 AI 「AlphaStar」
DeepMind 对强化学习的理解越来越深
杨晓凡
01月25日 08:19
DeepMind
AlphaGo
人工智能
强化学习
1
2
3
4
5
6
...
9
相关文章
AAAI 2019 四个杰出论文奖论文揭晓
强化学习基础 - 共轭梯度
强化学习基础-对偶梯度上升
多图详解 DeepMind 的超人类水准星际争霸 AI 「AlphaStar」
谷歌和UC伯克利的新式Actor-Critic算法快速在真实世界训练机器人
热门搜索
小米
智能手表
阿里云
运营商
Apple Pay
AMD
自动驾驶汽车
AI教育
联通
海康
自行车
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请
验证邮箱
您的邮箱还未验证,完成可获20积分哟!
重发邮箱
修改邮箱
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以
设置密码
以方便用邮箱登录
立即设置
以后再说