通过简单代码回顾卷积块

本文作者： AI研习社-译站

2018-08-22 14:28

导语：在本文中，我想引导你通过 Keras 实现精选的最新架构的重要卷积块。

本文为 AI 研习社编译的技术博客，原标题 History of Convolutional Blocks in simple Code，作者为 Paul-Louis Pröve。
翻译 | 孟凡校对 | Lamaric 审核 | Lamaric

通过简单代码回顾卷积块我会努力定期去阅读机器学习和人工智能相关的论文。这也是能够持续跟进最新进展的唯一途径。作为一名计算机科学家，我经常在翻阅科学描述文本或者公式的数学符号时碰壁。我发现在普通代码中理解它要容易的多。因此在本文中，我想引导你通过 Keras 实现精选的最新架构的重要卷积块。

当你在 GitHub 上查阅受欢迎的架构实现的时候，你一定会惊讶于他们怎么会包含这么多代码。这是一个很好的包含足够数量的注释并且使用额外参数来增强模型的实践，但是与此同时这会分散架构本质的注意力。为了更加简化和缩短代码，我将使用一些别名函数：

通过简单代码回顾卷积块

我发现当删除模版代码时更具有可读性。当然，这只有在您理解我的首字母缩写后才有效，让我们开始吧!

瓶颈块

卷积层的参数数量取决于卷积核大小、输入滤波器和输出滤波器的的数量。你的网络越宽，3x3 卷积就会付出更大的代价。

通过简单代码回顾卷积块

瓶颈块背后的思想是通过一个确定的比率 r 采用代价小的 1x1 卷积来减少通道数，以便随后的 3x3 卷积具有更少的参数。最后，我们在再使用一个 1x1 的卷积拓宽网络。

Inception 模块

Inception 模块引入了并行使用不同操作并且合并结果的思想。因此网络可以学习不同类型的滤波器。

通过简单代码回顾卷积块

这里我们使用卷积核大小为 1、3 和 5 的卷积层和 MaxPooling 层进行合并。这段代码展示了inception模块的原始实现。实际的实现是将它与上述瓶颈的思想结合起来，这使得它稍微复杂了一些。

通过简单代码回顾卷积块

Residual 块

通过简单代码回顾卷积块

ResNet 是一个被来自微软的研究者推出的架构，它允许神经网络拥有他们希望得到的层数，同时仍能够提高模型的准确度。到现在你或许已经习惯它了了，但是在ResNet 之前情况并非如此。

通过简单代码回顾卷积块

这个想法是将初始的激活添加到卷积块的输出。因此网络可以通过学习过程决定用于输出的新卷积的数量。做的注意的是Inception模块串联输出，而Residual模块是求和。

ResNeXt 块

基于它的名字你就能够猜到ResNeXt与ResNet的密切联系。作者将基数一词云如到另一个维度，比如宽度（通道数）和深度（层数）。

基数（cardinality）是指出现在模块中的平行路径数。这听起来像inception块并行发生的四个操作。然而，并非并行使用不同类型的操作，基数为4时是简单的使用相同操作四次。

如果它们做的是同样的事情为什么还要把他们并列？好问题。这个概念也被称作分组卷积而且可以追溯到原始的AlexNet论文。虽然，当时它主要被用做分解训练过程到多个GPU，而ResNeXt则用他们来增加参数的利用效率。

通过简单代码回顾卷积块

这个想法是将所有的输入通道分成几个组。卷积只会在它们专属的通道组中进行而不会影响到所有通道组。发型每个组将会学到不同类型的特征，同时提高了权重的效率。

想象一个瓶颈块，首先使用一个为4的压缩率将256个输入通道减少到64个，然后将它们恢复到256个通道作为输出。如果我们想引入基数32和压缩率2，我们将使用32个平行的1x1的卷积层，其每个的输出通道为4(256/(32*2))个。之后我们使用32个拥有4个输出通道的3x3的卷积层，紧接着是32个1x1层，每个层有256个输出通道。最后一步包含将32个平行路径相加，使得在加上初始输入作为一个残差连接之前为我们提供单个输出。

通过简单代码回顾卷积块