(Python)零起步数学+神经网络入门

fendouai • 2018年12月26日 am12:00 • TensorFlowNews

点击上方“磐创AI”，选择“置顶公众号”

精品文章，第一时间送达

(Python)零起步数学+神经网络入门

转载自：云栖社区，未经允许不得二次转载

摘要：手把手教你用(Python)零起步数学+神经网络入门！

在这篇文章中，我们将在Python中从头开始了解用于构建具有各种层神经网络（完全连接，卷积等）的小型库中的机器学习和代码。最终，我们将能够写出如下内容：

(Python)零起步数学+神经网络入门

假设你对神经网络已经有一定的了解，这篇文章的目的不是解释为什么构建这些模型，而是要说明如何正确实现。

逐层

我们这里需要牢记整个框架：

1. 将数据输入神经网络

2. 在得出输出之前，数据从一层流向下一层

3. 一旦得到输出，就可以计算出一个标量误差。

4. 最后，可以通过相对于参数本身减去误差的导数来调整给定参数（权重或偏差）。

5. 遍历整个过程。

最重要的一步是第四步。我们希望能够拥有任意数量的层，以及任何类型的层。但是如果修改/添加/删除网络中的一个层，网络的输出将会改变，误差也将改变，误差相对于参数的导数也将改变。无论网络架构如何、激活函数如何、损失如何，都必须要能够计算导数。

为了实现这一点，我们必须分别实现每一层。

每个层应该实现什么

我们可能构建的每一层（完全连接，卷积，最大化，丢失等）至少有两个共同点：输入和输出数据。

(Python)零起步数学+神经网络入门

现在重要的一部分

假设给出一个层相对于其输出（∂E/∂Y）误差的导数，那么它必须能够提供相对于其输入（∂E/∂X）误差的导数。

(Python)零起步数学+神经网络入门

(Python)零起步数学+神经网络入门

(Python)零起步数学+神经网络入门

我们可以使用链规则轻松计算∂E/∂X的元素：

(Python)零起步数学+神经网络入门

为什么是∂E/∂X？

对于每一层，我们需要相对于其输入的误差导数，因为它将是相对于前一层输出的误差导数。这非常重要，这是理解反向传播的关键！在这之后，我们将能够立即从头开始编写深度卷积神经网络！

花样图解

基本上，对于前向传播，我们将输入数据提供给第一层，然后每层的输出成为下一层的输入，直到到达网络的末端。

(Python)零起步数学+神经网络入门

对于反向传播，我们只是简单使用链规则来获得需要的导数。这就是为什么每一层必须提供其输出相对于其输入的导数。

(Python)零起步数学+神经网络入门

这可能看起来很抽象，但是当我们将其应用于特定类型的层时，它将变得非常清楚。现在是编写第一个python类的好时机。

抽象基类：Layer

所有其它层将继承的抽象类Layer会处理简单属性，这些属性是输入，输出以及前向和反向方法。

(Python)零起步数学+神经网络入门

正如你所看到的，在back_propagation函数中，有一个我没有提到的参数，它是learning_rate。此参数应该类似于更新策略或者在Keras中调用它的优化器，为了简单起见，我们只是通过学习率并使用梯度下降更新我们的参数。

全连接层

现在先定义并实现第一种类型的网络层：全连接层或FC层。FC层是最基本的网络层，因为每个输入神经元都连接到每个输出神经元。

(Python)零起步数学+神经网络入门

前向传播

每个输出神经元的值由下式计算：

(Python)零起步数学+神经网络入门

使用矩阵，可以使用点积来计算每一个输出神经元的值：

(Python)零起步数学+神经网络入门

当完成前向传播之后，现在开始做反向传播。

反向传播

正如我们所说，假设我们有一个矩阵，其中包含与该层输出相关的误差导数（∂E/∂Y）。我们需要：

1.关于参数的误差导数（∂E/∂W，∂E/∂B）

2.关于输入的误差导数（∂E/∂X）

首先计算∂E/∂W，该矩阵应与W本身的大小相同：对于ixj，其中i是输入神经元的数量，j是输出神经元的数量。每个权重都需要一个梯度：

(Python)零起步数学+神经网络入门

使用前面提到的链规则，可以写出：

(Python)零起步数学+神经网络入门

那么：

(Python)零起步数学+神经网络入门

这就是更新权重的第一个公式！现在开始计算∂E/∂B：

(Python)零起步数学+神经网络入门

同样，∂E/∂B需要与B本身具有相同的大小，每个偏差一个梯度。我们可以再次使用链规则：

(Python)零起步数学+神经网络入门

得出结论：

(Python)零起步数学+神经网络入门

现在已经得到∂E/∂W和∂E/∂B，我们留下∂E/∂X这是非常重要的，因为它将“作用”为之前层的∂E/∂Y。

(Python)零起步数学+神经网络入门

再次使用链规则：

(Python)零起步数学+神经网络入门

最后，我们可以写出整个矩阵：

(Python)零起步数学+神经网络入门

(Python)零起步数学+神经网络入门

(Python)零起步数学+神经网络入门

编码全连接层

现在我们可以用Python编写实现：

(Python)零起步数学+神经网络入门

激活层

到目前为止所做的计算都完全是线性的。用这种模型学习是没有希望的，需要通过将非线性函数应用于某些层的输出来为模型添加非线性。

现在我们需要为这种新类型的层（激活层）重做整个过程！

不用担心，因为此时没有可学习的参数，过程会快点，只需要计算∂E/∂X。

(Python)零起步数学+神经网络入门

前向传播

正如将看到的，它非常简单。对于给定的输入X，输出是关于每个X元素的激活函数，这意味着输入和输出具有相同的大小。

(Python)零起步数学+神经网络入门

反向传播

给出∂E/∂Y，需要计算∂E/∂X

(Python)零起步数学+神经网络入门

注意，这里我们使用两个矩阵之间的每个元素乘法（而在上面的公式中，它是一个点积）

编码实现激活层

激活层的代码非常简单：

(Python)零起步数学+神经网络入门

可以在单独的文件中编写一些激活函数以及它们的导数，稍后将使用它们构建ActivationLayer：

(Python)零起步数学+神经网络入门

损失函数

到目前为止，对于给定的层，我们假设给出了∂E/∂Y（由下一层给出）。但是最后一层怎么得到∂E/∂Y？我们通过简单地手动给出最后一层的∂E/∂Y，它取决于我们如何定义误差。

网络的误差由自己定义，该误差衡量网络对给定输入数据的好坏程度。有许多方法可以定义误差，其中一种最常见的叫做MSE – Mean Squared Error：

(Python)零起步数学+神经网络入门

其中y *和y分别表示期望的输出和实际输出。你可以将损失视为最后一层，它将所有输出神经元吸收并将它们压成一个神经元。与其他每一层一样，需要定义∂E/∂Y。除了现在，我们终于得到E！

(Python)零起步数学+神经网络入门

以下是两个python函数，可以将它们放在一个单独的文件中，将在构建网络时使用。

(Python)零起步数学+神经网络入门

网络类

到现在几乎完成了！我们将构建一个Network类来创建神经网络，非常容易，类似于第一张图片！

我注释了代码的每一部分，如果你掌握了前面的步骤，那么理解它应该不会太复杂。

(Python)零起步数学+神经网络入门

构建一个神经网络

最后！我们可以使用我们的类来创建一个包含任意数量层的神经网络！为了简单起见，我将向你展示如何构建……一个XOR。

(Python)零起步数学+神经网络入门

同样，我认为不需要强调很多事情，只需要仔细训练数据，应该能够先获得样本维度。例如，对于xor问题，样式应为（4,1,2）。

结果

(Python)零起步数学+神经网络入门

卷积层

这篇文章开始很长，所以我不会描述实现卷积层的所有步骤。但是，这是我做的一个实现：

(Python)零起步数学+神经网络入门

它背后的数学实际上并不复杂！这是一篇很好的文章，你可以找到∂E/∂W，∂E/∂B和∂E/∂X的解释和计算。

如果你想验证你的理解是否正确，请尝试自己实现一些网络层，如MaxPooling，Flatten或Dropout

GitHub库

https://github.com/OmarAflak/Medium-Python-Neural-Network

你可以在GitHub库中找到用于该文章的完整代码。

本文由阿里云云栖社区组织翻译。

文章原标题《math-neural-network-from-scratch-in-python》

作者：Omar Aflak 译者：虎说八道，审校：袁虎。

(Python)零起步数学+神经网络入门

你也许还想看：

● 腾讯王者荣耀AI论文首次曝光：五AI王者局开黑与人类战队打成平手

● 我数学不好、不爱刷题，如何入门机器学习？

● 圣诞有礼 | 送免费公开课+机器学习+CV经典书籍共 14 本

欢迎扫码关注：

(Python)零起步数学+神经网络入门

觉得赞你就点好看，多谢大佬

磐创AI：http://www.panchuangai.com/ 智能客服：http://www.panchuangai.com/ TensorFlow：http://panchuang.net 推荐关注公众号：磐创AI

原创文章，作者：fendouai，如若转载，请注明出处：https://panchuang.net/2018/12/26/4f5da427e0/

赞 (0)

fendouai 注册用户

0 0

圣诞有礼 | 送免费公开课+机器学习+CV经典书籍共 14 本

« 上一篇 2018年12月25日 am12:00

使用Pytorch训练分类器详解（附python演练）

下一篇 » 2018年12月27日 am12:00

发表评论取消回复

登录后才能评论

联系我们

400-800-8888

在线咨询：

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息