机器学习笔记2——神经网络

发表: 2018-10-30 浏览: 1400

机器学习

神经网络

神经网络是由具有适应性的简单单元组成的广泛并行互连得网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。

神经网络中最基本的成分。

1.感知机是由两层神经元组成的。

2.多层功能神经元：两层感知机，输出层与输入层之间的一层神经元叫做隐层或隐含层。隐含层和输出层神经元都是拥有激活函数的功能神经。

3.多层前馈神经网络：层级结构。每层神经元与下一层神经元全互连，神经元之间不存在同层连接。也不存在跨层连接。

（前馈并不是意味着网络中信号不能向后传，而是指网络拓扑结构上不存在环或回路）

只需包含隐层即可称为多层网络。

神经网络“学”到的东西就蕴含在连接权和阈值中。

最成功的神经网络算法

BP算法不仅可用于多层前馈神经网络，还可用于其他类型的神经网络（e,g递归神经网络），但通常讲到的“BP网络”时一般指用BP算法训练多层前馈神经网络。

标准BP算法：

每次只针对单个样例，参数更新得非常频繁，而且对不同样例进行更新的效果可能出现“抵消”现象。因此，为了达到同样的累积误差极小点，标准BP算法往往需进行更多次的迭代。

BP网络中的过拟合问题：

因为其强大的表示能力，BP神经网络经常遭遇过拟合，其训练误差持续走低，但测试误差却可能上升。

两种策略：

第一个策略：早停

将数据分为训练集和验证集，训练集用来计算梯度、更新连接权和阈值，验证集用来估计误差，若训练集误差降低但验证集误差升高，则停止训练，同时返回具有最小验证集误差的连接权和阈值。

第二个策略：正则化

在误差目标函数中增加一个描述网络复杂度的部分，例如连接权与阈值的平方和。增加后，训练过程将会偏好比较小的连接权和阈值，使网络输出更加“光滑”，从而对过拟合有所缓解。

局部最小解是参数空间中的某个点，其领域点的误差函数值均不小于该点的函数值；

全局最小解是指参数空间中所有点的误差函数值均不小于该点的函数值。

参数空间中内梯度为零的点，只要其误差函数值小于领点的误差函数值，就是局部极小点。

可能存在多个局部极小点，但却只会有一个全局最小值。即全局最小一定是局部最小。

陷入局部极小：误差函数具有多个局部极小，则不能保证找到的解是全局最小。

“跳出”局部最小的策略：

“模拟退火”：在每一步都一一定的概率接受比当前解更差的结果，从而有助于“跳出”局部最小。在每步迭代过程中，接受“次优解”的概率要随着时间的推移而逐渐降低，从而保证算法稳定。但也会跳出全局最小。

以上为启发式，理论上尚缺乏保障。

要回复文章请先登录或注册