您正在使用IE低版浏览器，为了您的雷峰网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器

此为临时链接，仅用于文章预览，将在时失效

人工智能正文

发私信给camel

发送

0

Hinton亲自讲解迄今未发表工作：胶囊理论的核心概念到底是什么？

本文作者： camel

编辑：郭奕欣

2017-08-20 23:27

导语：这个理论会不会再次让他成为“the Father of ……” ？

雷锋网AI科技评论消息：近日，在加拿大多伦多大学向量学院发起的“2017 - 2018年机器学习进展与应用”研讨会上，神经网络之父Geoffrey Hinton做了一场报告《What is wrong with convolutional neural nets?》，在报告中Hinton讲解了他多年来一直在做的研究工作，他称之为“胶囊理论”（capsules theory）。

Hinton亲自讲解迄今未发表工作：胶囊理论的核心概念到底是什么？

在报告中，他认为“标准神经网络”与真实的大脑神经网络相比有以下四个问题：

1、池化过程并没有很好地模仿大脑中形状知觉的心理过程——它不能解释为什么我们人类能将内在的坐标系映射到物体上，以及为什么这些坐标系这么重要；

2、池化解决的问题是错的——我们想要的是信息的同变性而不是不变性，是理清信息而不是丢弃信息；

3、池化没有利用底层线性结构——它没有利用在图形中能很好地处理方差最大来源的自然线形流形。

4、池化在处理动态路由时很差劲——我们需要将输入信息的每一部分路由到知道如何处理它的神经元中，找到最佳的路径就是在解析图像。

Hinton亲自讲解迄今未发表工作：胶囊理论的核心概念到底是什么？

Hinton提出了他“胶囊”（capsules）的概念。简单地说，这些“胶囊”就是在神经网络中构建和抽象出的子网络。什么意思呢？一个标准的神经网络，层与层之间是全连接的（也就是说，层1中的每个神经元都可以访问层0中的每个神经元，并且其本身也可以被层2中每个神经元所访问），但这些连接并不一定都是有用的。“胶囊理论”的方案是，神经网络由n个子网络（胶囊）构成，每个胶囊都专注于做一些单独的任务，胶囊本身可能需要多个层网络来实现。其输出包括物体所属类型的概率以及物体的状态信息（比如位置、方向、大小、形变、速率、颜色等）。低层次胶囊输出的参数会被转换成高层级胶囊对实体状态的预测，如果预测一致，则输出这一层次的参数。

Hinton亲自讲解迄今未发表工作：胶囊理论的核心概念到底是什么？

一个典型的胶囊将从多个低层次的胶囊中获得信息（多维预测向量），然后寻找一个预测的紧致束（tight cluster of predication）。如果它能够找到这个紧致束，那么它就会输出实体在这个域内类型存在的较高的概率，以及生成状态的重心（状态平均值）。这种方式可以很好地过滤掉噪声，因为较高维度的巧合发生的概率很小，所以胶囊的方法要比“标准的神经网络”好很多。Hinton说，他这种“胶囊”的想法是受到脑科学中对“迷你列组织”（mini-column organization）研究的很大的启发。

此外，据雷锋网了解，关于“胶囊理论”的研究Hinton已在多个场合做过类似的报告，不过目前Hinton好想并没有打算把他的研究成果发表出去，因为他觉得现在的研究还没有让他满意——那么，当他对这项研究满意的时候，会不会再次成为“the Father of ……” ？

雷锋网注：资源链接——

1、What's wrong with convolutional nets? @MIT TechTV(2014年在“脑与认知科学”研讨会上的报告视频，内容类似)

2、Hinton未发表工作：Transforming Auto-encoders（PDF）

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

2人收藏

分享：

相关文章

camel

编辑

持身秉正

扫描关注作者微信

发私信

当月热门文章

最新文章

热门搜索

阿里巴巴阿里视频监控运营商 O2O 智能眼镜 iPad Pro 微信支付 eBay 李飞飞 Disrupt大会

为了您的账户安全，请验证邮箱

您的邮箱还未验证,完成可获20积分哟！

重发邮箱修改邮箱

请验证您的邮箱

立即验证

完善账号信息

您的账号已经绑定，现在您可以设置密码以方便用邮箱登录

立即设置 以后再说