Facebook Yann LeCun一小时演讲： AI 研究的下一站是无监督学习（附完整视频）

本文作者：三川

2016-11-21 18:43

导语：Facebook AI 部门负责人 Yann LeCun 近日进行了一场 AI 技术核心问题与发展前景的演讲，他重申了无监督学习对下一步 AI 发展的关键作用。

作为 Facebook 人工智能部门主管， Yann LeCun 是 AI 领域成绩斐然的大牛，也是行业内最有影响力的专家之一。

近日，LeCun在卡内基梅隆大学机器人研究所进行了一场 AI 技术核心问题与发展前景的演讲。他在演讲中提到三点干货：

1. 无监督学习代表了 AI 技术的未来。
2. 当前 AI 应用的热点集中在卷积神经网络。
3. 用模拟器提高无监督学习的效率是大势所趋。

演讲完整视频如下。该视频长 75 分钟，并包含大量专业术语，因此雷锋网节选关键内容做了视频摘要，以供读者浏览。

以下为视频摘要：

一、无监督学习的重要性

AI 技术的飞速进步很大程度上是由于深度学习和神经网络领域的突破，还得益于大型数据库的建立和更快的 GPU。我们现在已有了图像识别能力可与人类相比的 AI 系统（例如下文中 Facebook 的识别系统）。这会导致自动化交通，医疗图像解析在内的多个领域的革命。但这些系统现在用的都是监督学习（supervised learning），输入的数据被人为加上标签。

接下来的挑战在于，怎么让机器从未经处理的、无标签无类别的数据中进行学习，比方说视频和文字。而这就是无监督学习（unsupervised learning）。

二、神经网络的规模越大越好

传统的思想认为，如果你没有大量的数据，神经网络应该控制在较小的规模。Yann LeCun 指出这完全是错误的。他的团队在数据不变的情况下扩展了神经网络，得到了更好的结果。他说，神经网络越大，效果就越好（当然前提是数据库大小达到了临界值）。至于为什么会这样，目前仍是一个谜，相关理论研究正在开展。

三、卷积神经网络在识别领域的广阔前景

Yann LeCun 特别强调了卷积神经网络的重要性和应用：”我们很早就认识到，卷积神经网络可以被用来处理多种任务——不单单是识别单个物体（比如字母数字），还可以识别多个物体，同时进行物体识别、分组和解释。比方说，可以用卷积神经网络训练 AI 系统识别并标注（摄像头所拍摄）图像中的每一个像素，以此分析前方路径是否可通过。在英伟达最近的自动驾驶项目中，他们就使用了卷积神经网络来训练自动驾驶系统。系统分析摄像头提供的图像，据此模仿人类的转向角度。“

他还介绍了卷积神经网络在 Facebook 图像识别系统中的应用。“有了它之后，Facebook 的系统不仅能识别图像，还能绘制出图像的轮廓，并根据轮廓影像对物体进行分类。该系统甚至可以挑出中国菜里面的西兰花（如下图）。”

Facebook Yann LeCun一小时演讲： AI 研究的下一站是无监督学习（附完整视频）

下面是对同一幅图像识别前后的对比：

Facebook Yann LeCun一小时演讲： AI 研究的下一站是无监督学习（附完整视频）

Yann LeCun 表示这是一个巨大的进步，如果你在几年前问一个 AI 专家：”我们什么时候才能做到这样？”，答案会是“不清楚”。

“ 想让 AI 技术继续进步，我们就必须要让机器能够分析、推理、记忆，把现象和文字转化为运行知识。”

他接着作出预测，下一个将会十分流行的技术是记忆增强神经网络。它可被理解为用记忆增强的递归神经网络，其中，记忆本身是一个能被区分的回路，并可以作为学习中的一部分用于训练。Yann LeCun 接下来对该技术进行了深入探讨，这里不赘述，详情请见视频。

四、强化学习、监督学习、无监督学习的数据要求

进行强化学习、监督学习、无监督学习的所需数据规模相差数个数量级。强化学习每次验证（trial）所需的信息可能只有几比特，监督学习是十到一万比特的信息量，而无监督学习则需要数百万比特。所以，Yann LeCun 做了一个比喻：假设机器学习是一个蛋糕，强化学习是蛋糕上的一粒樱桃，监督学习是外面的一层糖衣，无监督学习则是蛋糕糕体。无监督学习的重要性不言而喻。为了让强化学习奏效，也离不开无监督学习的支持。

Facebook Yann LeCun一小时演讲： AI 研究的下一站是无监督学习（附完整视频）

五、用模拟机制提高强机器学习的效率

当下的主要问题是，AI 系统没有“常识”。人类和动物通过观察世界、行动和理解自然规律来获得常识，机器也需要学会这么做。包括 Yann LeCun 在内的许多专家，把无监督学习作为赋予机器常识的关键，该过程如下：

AI 系统由两部分组成：代理和目标（agent and objective）。代理做出行动，观察该行动对现实的影响产生认知，然后再通过该认知来预测现实情况。代理进行这一系列活动的动机来自于实现目标，而最终的目的则是：以最高的效率达到该目标。在强化学习中，对代理行为的奖励（reward）来自于外部，无监督学习的奖励则来自内部（对接近该目标的满意）。

Facebook Yann LeCun一小时演讲： AI 研究的下一站是无监督学习（附完整视频）

但这个过程存在一个很大的问题：代理进行无监督学习的方法是在现实生活中进行各种尝试，这存在危险并且效率很低。比如，无人驾驶车不能尝试所有可能的驾驶方法，会带来安全隐患。这种尝试又受到时间的限制，不能像计算机程序那样每秒运行数千次。所以，Yann LeCun 解释道，为了提高机器学习的效率，我们需要基于模型的强化学习（model based reinforcement learning ）。它由三部分组成：现实模拟器（world simulator），行动器（actor）和反馈装置（critic）。现实模拟器对现实情况进行模拟，行动器生成行动预案（action proposals），然后反馈装置对该行动的效果进行预测。这样，AI 系统就可以对行动反复推演，进行优化，而不受到现实中时间和成本的限制。

小结：作为业内大牛，Yann LeCun 的一举一动都受到关注。他之前就发表过对 AI 前景和无监督学习的若干讲话，这一次在卡内基梅隆的研究人员面前再次强调了他的观点。虽然这不是我们第一次听到专家强调无监督学习、甚至是卷积神经网络的重要性；但此次演讲中， Yann LeCun 借用许多技术细节和各大公司、研究院正在从事的研究作为示例，为无监督学习将来会怎样发展作了全面的注解。正因如此，雷锋网建议关注 AI 领域未来发展方向的读者，不妨抽出一个下午仔细听一下演讲，必定会有收获。

【招聘】雷锋网坚持在人工智能、无人驾驶、VR/AR、Fintech、未来医疗等领域第一时间提供海外科技动态与资讯。我们需要若干关注国际新闻、具有一定的科技新闻选题能力，翻译及写作能力优良的外翻编辑加入。工作地点深圳。简历投递至 guoyixin@leiphone.com 。兼职及实习均可。