强化学习

本专题为雷峰网的强化学习专题，内容全部来自雷峰网精心选择与强化学习相关的最近资讯，雷峰网读懂智能与未来，拥有强化学习资讯的信息，在这里你能看到未来的世界。

强化学习最新资讯

人工智能

AI Agent 发展史：从 RL 驱动到大模型驱动｜AIR 2025

从 Agent 前沿研究中一窥复制 Manus 的启示。

王悦
03月31日 20:23

AIR2025 强化学习 Agent
人工智能学术

万字梳理：揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

Transformer架构的非递归设计阻碍了跨层的记忆共享，或限制模型泛化能力。

王悦
02月28日 20:26

AIR2025 强化学习 DeepSeek
人工智能

UCL强化学习派：汪军与他的学生们

导语：他们构成中国强化学习研究的半壁江山。

赖文昕
02月27日 19:15

强化学习 UCL 汪军
人工智能

伯克利罗剑岚：机器人的范式革命，藏在真实世界中

导语：Sergey Levine 对罗剑岚说，“You really made RL work.”

赖文昕
11月12日 16:23

强化学习具身智能伯克利
人工智能

伯克利具身智能图谱：深度强化学习浪尖上的中国 90 后们

导语：吴翼、高阳、许华哲、陈建宇、汤特、段岩、陈曦、张天浩、罗剑岚.....深度强化学习与机器人的相映交辉下，是一代英才辈出。

赖文昕
11月12日 16:06

具身智能伯克利强化学习
人工智能学术

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

洞察未来趋势，更能够激发新的思考，共同推动强化学习与大模型技术的结合与应用

岑大师
08月23日 11:43

强化学习大模型研讨会
人工智能学术

对话南洋理工大学安波教授：如何让大语言模型适应动态环境？丨IJAIRR

智能体实现AGI的自我超越，从与环境交互做起。

岑大师
07月18日 10:09

Twosome 大模型强化学习
人工智能

ChatGPT 加持，决策大模型距离 AGI 更进一步

AI 需要多智能体的相互作用来引发意识。

黄楠
03月28日 10:50

决策大模型 ChatGPT 多智能体强化学习
人工智能学术

内存减少3%-7%！谷歌提出用于编译器优化的机器学习框架 MLGO

谷歌整活！将更快、更小的编译代码置入通用型工业级框架。

我在思考中
07月11日 10:00

强化学习机器学习策略神经网络
人工智能学术

谷歌大脑新研究：强化学习如何学会用声音来观察？

作者在论文中设计了一系列强化学习系统，其能够将来自环境的每种感觉输入到不相同，却具有一定联系的神经网络中，值得一提的是，这些神经网络之间没有固定的关系。

我在思考中
10月11日 18:41

谷歌大脑强化学习感官替代

12 3 4 5...10