GMM原理及EM算法的优劣对比详解：谁才是GMM的“最佳拍档”？

2024-01-14 17:23:59

GMM：驾驭高斯混合模型的艺术

在机器学习领域，理解高斯混合模型（GMM）至关重要，因为它是一种功能强大的聚类技术，可将数据划分成服从高斯分布的子集。然而，GMM 学习的精髓在于参数估计，而这正是本文将深入探讨的焦点。

最大似然估计：直接但具有局限性

最大似然估计 (MLE) 是一种直接的参数估计方法，通过最大化数据似然函数来估算参数。对于 GMM，似然函数是所有数据点属于 GMM 的概率的乘积。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.mixture import GaussianMixture

# 生成样本数据
data = np.random.randn(200, 2)  # 200个二维高斯分布样本

# 使用 MLE 拟合 GMM
gmm = GaussianMixture(n_components=2).fit(data)

# 获取 GMM 参数
means = gmm.means_
covariances = gmm.covariances_
weights = gmm.weights_

# 可视化数据和拟合的 GMM
plt.scatter(data[:, 0], data[:, 1])
plt.xlabel("特征 1")
plt.ylabel("特征 2")
plt.show()

虽然 MLE 简单易行，但它容易陷入局部最优，并且对初始值敏感。这意味着，根据不同的初始参数，MLE 可能会收敛到不同的解，从而导致次优结果。

EM 算法：迭代优化，避免局部最优

期望最大化 (EM) 算法提供了一种更稳健的参数估计方法，可以克服 MLE 的局限性。EM 算法交替执行两个步骤：

E 步： 计算数据点属于每个高斯分量的后验概率。
M 步： 使用这些后验概率更新 GMM 参数。

# 使用 EM 算法拟合 GMM
gmm = GaussianMixture(n_components=2, covariance_type='full').fit(data)

# 获取 GMM 参数
means = gmm.means_
covariances = gmm.covariances_
weights = gmm.weights_

# 可视化数据和拟合的 GMM
plt.scatter(data[:, 0], data[:, 1])
plt.xlabel("特征 1")
plt.ylabel("特征 2")
plt.show()