归一化方法综述：BN 及其演化

2024-01-13 07:56:52

引言

归一化技术是机器学习和深度学习领域必不可少的工具，旨在通过调整数据分布，使其符合特定的标准或要求。在过去几年中，归一化方法蓬勃发展，不断演化出新的技术来满足不同的应用需求。本文将重点介绍归一化方法的演进，从最初的批归一化 (BN) 到近期提出的各种变体。

批归一化 (BN)

BN 由 Sergey Ioffe 和 Christian Szegedy 在 2015 年提出，是归一化方法的开山鼻祖。BN 通过对每个小批量的数据进行归一化，减轻了内部协变量转移问题，提高了训练的稳定性和泛化能力。

层归一化 (LN)

LN 由 Ba 等人在 2016 年提出，是一种在每个层上进行归一化的变体。LN 在训练过程中消除层间协变量转移，使得模型更易于训练，特别是对于深层网络。

实例归一化 (IN)

IN 由 Ulyanov 等人在 2016 年提出，旨在针对每个样本的输入数据进行归一化。IN 适用于处理图像和自然语言处理等具有实例差异性较大的数据，能够有效解决小样本训练问题。

激活函数归一化 (AFN)

AFN 由 Li 等人在 2019 年提出，通过对激活函数的输出进行归一化，来缓解梯度消失和爆炸问题。AFN 可以在训练过程中稳定激活函数的分布，提高训练效率和模型性能。

自归一化

自归一化技术包括 Noisy Normalization (NN) 和 Switch Normalization (SN)，分别由 Krizhevsky 等人和 Luo 等人在 2019 年和 2020 年提出。这些技术通过引入噪声或非确定性机制，增强模型的泛化能力，防止过拟合。

权重归一化

权重归一化技术包括 Weight Normalization (WN) 和 Layer Normalization for Convolutions (LN-Conv)，分别由 Salimans 和 Kingma 等人在 2016 年和 2017 年提出。这些技术通过对网络权重进行归一化，稳定梯度流，缓解训练困难的问题。