北京大学何宇健：传统算法如何转化成神经网络？

本文作者：杨文

2017-12-14 10:49

导语：传统算法如何走向神经网络

雷锋网AI研习社按：在当今AI时代中，CNN和RNN都被广泛关注，并且有很多相关讨论，而最基础的神经网络DNN，它的研究和曝光度却相对较少。DNN是所有其它神经网络的基础，所以对它有一定了解是必要的。本文为大家详细介绍了传统机器学习的基本概念和神经网络的基本结构，以及如何设计神经网络结构让神经网络表达出朴素贝叶斯和决策树这两大传统算法模型。文章内容根据AI研习社线上分享课整理而成。

我们都知道神经网络很强，但却只有很少人去思考它为什么这么强。在近期雷锋网AI研习社的线上分享会上，资深Python工程师何宇健为我们分享了如何设计神经网络结构让神经网络表达出朴素贝叶斯和决策树这两大传统算法模型。希望这种设计能让大家从直观上感受到神经网络的强大。

何宇健，《Python与机器学习实战》作者，来自北京大学数学系，有多年Python开发经验，在GitHub上拥有并维护着一个纯Python编写的机器学习算法库（180个stars，100个forks）。曾在创新工场AI工程院负责研发适用于结构化数据的新型神经网络。希望这种设计能让大家从直观上感受到神经网络的强大。

分享内容：

北京大学何宇健：传统算法如何转化成神经网络？

机器学习的基本概念与神经网络的基本结构
朴素贝叶斯、决策树算法简介以及它和神经网络的关系
具体的实现说明，以及可以做出改进与创新

大家好，我是何宇健。在当今的AI时代中，CNN和RNN都被广泛关注，并且有很多相关讨论，’而最基础的神经网络DNN，它的研究和曝光度却相对比较少。DNN是所有其它神经网络的基础，所以对它有一定了解是必要的。有些同学可能对机器学习相关概念不熟悉，因此分享的所有内容都从最基础的开始讲起。

分享主要内容通过设计神经网络结构来让神经网络表达出朴素毕叶思和决策树这两大传统算法模型。希望这种设计能让大家从直观上感受到神经网络的强大。

机器学习的基本概念及神经网络的基本结构

本次分享涉及的问题都是有监督学习问题。所谓有监督学习，就是对一个模型来说，它的输入都会对着一个目标。最终目的是模型的输出和目标尽可能接近。

北京大学何宇健：传统算法如何转化成神经网络？

机器学习术语：

特征向量：模型接受的输入通常称为特征向量，用字母X代指。
标签：模型拟合的目标通常称为标签，用字母Y代指。
样本：通常听到的“样本”概念是特征向量+标签的组合，用d=(x,y)代指
数据集：就是很多个样本的集合，通常用D=（d1,d2,...dn）代指。
损失函数：计算单个样本上模型的“损失”的函数。
代价函数：计算整个数据集上模型的“代价”的函数。

接下里进入神经网络正题的讨论。

神经网络包含输入层，隐藏层，输出层。在说有多少层神经网络时，我们不会把第一层算入其中，也就是输入层。

北京大学何宇健：传统算法如何转化成神经网络？