deeplearningai读书笔记（一）

原创

opprash

修改于 2019-09-27 09:40:43

4440

修改于 2019-09-27 09:40:43

文章被收录于专栏：大数据和机器学习大数据和机器学习

神经网络权值初始化方案

0值初始话：初始化网络的所有权值为0，在反向传播的而过程中由于权重系数都为0导致所有的维度权重相同，此时每一层退化为只有一个神经元。

随机初始化：采用均值为1，方差为0的随机正太分布作并且很小的数据来初始化权值，这解决了网络退化为一个神经元的问题，但是另一方面，网络很深后，整个网络的梯度小时就变得特别严重。

Xavier初始化：当激活函数为tanh（x）时候的的初始化方案，解决随机初始化梯度消失的问题，当时另一方面它只适用于tanh(x)的情况，当激活函数为Relu的时候学习效率变得很低。

He初始化：当激活函数为Relu（x）时候的的初始化方案。

基于编码-解码（Encoder-Decoder）的序列到序列架构，又叫做seq2seq模型

思想：

seq2seq模型主要应用在机器翻译等领域，在进行机器翻译时，我们都知道比如中文翻译成英文的时候，翻译之后的英文和中文一般是不相等的，这个时候用seq2seq模型就很有优势了，他是RNN的一个典型变种，R x M形状的，即我们的翻译分为两个阶段，encoder阶段,结构先将输入数据编码成一个上下文向量c：