L0、L1、L2正则化：一步步理解正则化的发展历史

2023-09-27 03:37:58

正则化：机器学习模型的强大武器

L0正则化：稀疏性之美

L0正则化，也被称为稀疏正则化，旨在让模型的权重尽可能地稀疏，这意味着它们拥有尽可能多的零值。这种稀疏性不仅可以提高模型的可解释性，还可以降低其计算复杂度。

代码示例：

import numpy as np
from sklearn.linear_model import LogisticRegression

# 训练数据
X = np.array([[1, 2, 3], [4, 5, 6]])
y = np.array([0, 1])

# L0正则化逻辑回归模型
model = LogisticRegression(penalty='l0', C=1.0)
model.fit(X, y)

# 输出稀疏权重
print(model.coef_)

L1正则化：从稀疏到稳健

L1正则化，又称LASSO正则化，其目的在于使模型权重向量的L1范数最小化。L1范数是一个非光滑函数，因此L1正则化可以产生稀疏的权重向量。与L0正则化相比，L1正则化更稳定，不易受异常值的影响。

代码示例：

import numpy as np
from sklearn.linear_model import Lasso

# 训练数据
X = np.array([[1, 2, 3], [4, 5, 6]])
y = np.array([0, 1])

# L1正则化LASSO回归模型
model = Lasso(alpha=1.0)
model.fit(X, y)

# 输出稀疏权重
print(model.coef_)

L2正则化：平滑的权重空间

L2正则化，也被称为岭回归正则化，其目的是最小化模型权重向量的L2范数。L2范数是一个光滑函数，因此L2正则化可以产生平滑的权重向量。与L1正则化相比，L2正则化更平滑，可以防止模型过拟合。

代码示例：

import numpy as np
from sklearn.linear_model import Ridge

# 训练数据
X = np.array([[1, 2, 3], [4, 5, 6]])
y = np.array([0, 1])

# L2正则化岭回归模型
model = Ridge(alpha=1.0)
model.fit(X, y)

# 输出平滑权重
print(model.coef_)