您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给亚萌
发送

0

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

本文作者:亚萌 2016-12-05 21:09
导语:Open AI 宣布开源了其新平台“宇宙”(Universe)。这家由伊隆·马斯克资助的非赢利性AI开源组织,在NIPS 2016开始之前就搞了个大新闻。

当人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候,Open AI 宣布开源了其新平台“宇宙”(Universe)。这家由伊隆·马斯克资助的非赢利性AI开源组织,在周一的上午搞了个大新闻,相信NIPS的餐桌上一定热闹非凡。当然,Open AI后续也在NIPS的会场展示了自己的成果。

Open AI 联合创始人Greg Brockman 在Twitter上说道,“这个AI 训练架构,是我们从Open AI建立之初就在计划着的”。可见Open AI对这个平台的重视。

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

那么这个敢以“宇宙”命名的 Universe是个什么东西呢?

掌握人类的“普通智力”

OpenAI官网的介绍是:Universe软件平台,通过全世界的游戏、网页和其它应用,来测量和训练AI的普通智力。

在Universe上,AI智能体像人一样使用电脑:观看视频,并操作键盘和鼠标(只不过是虚拟的)。总而言之:人类可以在网络上做的事情,Universe都可以让AI智能体经历一遍,目的就是训练智能体掌握类似于人类的“普通智力”。

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

如今的AI技术,已经使计算机能看、能听和翻译,还能产生图像、声音和文本,AlphaGo甚至击败了李世石。

但是如今的AI技术仍然逃脱不了“窄AI”的范畴,也就是说,它可以在某一个特定领域达到超强表现,但是一旦超过这个领域,就无法工作。AlphaGo能在围棋上轻松赢过任何人,但是没法去玩其他的棋类游戏。

而Universe平台,就是为了打破“窄AI”的樊篱而诞生的。其核心架构由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建构。

OpenAI创始人Ilya Sutskever在接受《连线》采访时说道:“一个AI智能体就是应该能够解决你扔给它的任何问题。”这听起来有点过于大胆了,甚至有点“天方夜谭”。但Sutskever将Universe与ImageNet作类比,他认为ImageNet帮助计算机能够像人一样地“看见”,如今谷歌和Facebook的众多app已经可以做到这一点了,而Universe要做的,就是将人工智能朝向每一个维度扩展。

1000+训练环境

早在今年4月,OpenAI 发布了一个名为Gym的工具包,用来开发和比较增强学习算法,包括了众多训练环境(Environments)。如今在Universe上,任何一个程序都可以转变成一个Gym环境。

今天发布的Universe,可以在1000多个环境里运行,包括Flash 游戏、浏览器任务等。Universe 搞定了 Valve 和 Microsoft这样的游戏巨头,获得了游戏授权。

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

(Universe平台的部分合作方)

其实在游戏里训练智能体不是新鲜事儿,因为游戏的内容是可控的,有清晰的奖惩机制,所以智能体在其中可以稳定地学习什么可以做,什么不可以做。比如加拿大阿尔伯塔大学提供了经典游戏Atari的学习环境,微软则基于Minecraft游戏打造了Malmo系统。

可以说,从训练智能体这一点来看,视频游戏已经给真实世界带来了积极的影响。

不过相比而言,Universe不仅可以在众多游戏环境里,还能在浏览器任务等任何网络环境里运行,其覆盖面超过了以往任何同类系统。

意义:省钱

DeepMind之前建立了一个可以在Atari游戏里训练的智能体,并使用相似的技术来对谷歌全球数据中心网络进行精细化训练,以此来节省每年数百万美金的成本支出。

Craig Quiter目前是Otto公司的工程师,这家自动驾驶卡车公司今年夏天被Uber收购。 在任职Otto之前,Quiter曾参与过Universe的开发工作,由于此前对该平台早已熟悉,他对 Universe“省钱”的功能兴致勃勃,正在打造一个可以玩“侠盗猎车手V”游戏的智能体。

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

目前Otto的自动驾驶系统可以在相对平稳的环境下运行,但是在未来几年,该公司希望可以随时对路上遭遇的恶劣状况做出反应,而“侠盗猎车手V”里此起彼伏的惊险车况,对于Otto的自动驾驶系统是个很好的训练素材。

Sutskever表示,在长期看来,Universe平台以后甚至可以用于“迁移学习”:智能体把一个场景中学到的东西应用到另一个场景。他表示目前已经在着手建立一些智能体,将一个赛车游戏里学到的东西,应用在新的游戏里。


相关文章:

OPEN AI LAB,这个实验室如何加速人工智能的“进化”? | 深度

雷峰网原创文章,未经授权禁止转载。详情见转载须知

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

分享:
相关文章

编辑

关注人工智能(AI)报道
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说