“Internal Covariate Shift”问题该怎样解决？深度学习的学习样本是什么意思？

当前位置 : 首页 > 科技 >

“Internal Covariate Shift”问题该怎样解决？深度学习的学习样本是什么意思？

来源：创视网时间：2022-12-30 10:28:40

“Internal Covariate Shift”问题

从论文名字可以看出，BN是用来解决“Internal Covariate Shift”问题的，那么首先得理解什么是“Internal Covariate Shift”?

论文首先说明Mini-Batch SGD相对于One Example SGD的两个优势：梯度更新方向更准确;并行计算速度快;(为什么要说这些?因为BatchNorm是基于Mini-Batch SGD的，所以先夸下Mini-Batch SGD，当然也是大实话);然后吐槽下SGD训练的缺点：超参数调起来很麻烦。(作者隐含意思是用BN就能解决很多SGD的缺点)

接着引入covariate shift的概念：如果ML系统实例集合中的输入值X的分布老是变，这不符合IID假设，网络模型很难稳定的学规律，这不得引入迁移学习才能搞定吗，我们的ML系统还得去学习怎么迎合这种分布变化啊。对于深度学习这种包含很多隐层的网络结构，在训练过程中，因为各层参数不停在变化，所以每个隐层都会面临covariate shift的问题，也就是在训练过程中，隐层的输入分布老是变来变去，这就是所谓的“Internal Covariate Shift”，Internal指的是深层网络的隐层，是发生在网络内部的事情，而不是covariate shift问题只发生在输入层。

然后提出了BatchNorm的基本思想：能不能让每个隐层节点的激活输入分布固定下来呢?这样就避免了“Internal Covariate Shift”问题了，顺带解决反向传播中梯度消失问题。BN 其实就是在做 feature scaling，而且它的目的也是为了在训练的时候避免这种 Internal Covariate Shift 的问题，只是刚好也解决了 sigmoid 函数梯度消失的问题。

深度学习

深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。

深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

上一篇：出现了Ora-12514的原因是什么？关于服务器端的处理方法是什么？

下一篇：最后一页

X 关闭

新闻排行

为您推荐

拒绝服务攻击是什么意思？所谓的网络攻击都是攻击什么？

创视网 12-30
GNN与CNN、RNN都是什么意思有什么区别联系？循环神经网络是什么意思？

创视网 12-30
awk命令形式是什么意思？关于文本处理工具awk的简介是什么？

创视网 12-30
图神经网络是什么意思？人工神经网络就是网络连接模型吗？

创视网 12-30
虚拟机下载该怎样选择镜像版本？关于虚拟机技术你了解多少？

创视网 12-30
APP的界面显示该怎样改进和处理？处理器的定义该怎样进行理解？

创视网 12-30
app在运行过程中都有什么统一的特点？APP的数据库该怎样架构？

创视网 12-30
APP的运行环境该怎样理解使用？APP的开发语言都有什么？

创视网 12-30
硬盘的转速是什么意思？select into from与insert into select一样吗？

创视网 12-30
电脑硬盘是什么东西？关于SELECT…INTO这类程序你了解多少？

创视网 12-30