返回

一文看懂高斯分布的求解方法-最大似然估计

人工智能

高斯分布简介

高斯分布,也称为正态分布,是一种连续概率分布。它是许多统计模型的基础,包括线性回归、时间序列分析和机器学习。

一元高斯分布

一元高斯分布的概率密度函数为:

f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

其中,μ是分布的均值,σ是分布的标准差。

最大似然估计

最大似然估计是一种用于估计统计模型参数的方法。它是基于这样一个原理:模型参数的值应使模型的似然函数最大化。

对于一元高斯分布,似然函数为:

L(\mu, \sigma) = \prod_{i=1}^n f(x_i) = \left(\frac{1}{\sigma\sqrt{2\pi}}\right)^n e^{-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2}

其中,x_1, x_2, ..., x_n是样本数据。

要估计μ和σ的值,我们需要使似然函数最大化。我们可以通过求解似然函数的一阶偏导数并将其置零来做到这一点。

\frac{\partial L}{\partial \mu} = 0 \quad \frac{\partial L}{\partial \sigma} = 0

求解这些方程,我们可以得到μ和σ的估计值:

\hat{\mu} = \frac{1}{n}\sum_{i=1}^n x_i
\hat{\sigma} = \sqrt{\frac{1}{n}\sum_{i=1}^n (x_i-\hat{\mu})^2}

多元高斯分布

多元高斯分布是高斯分布的推广,它适用于多维数据。多元高斯分布的概率密度函数为:

f(\mathbf{x}) = \frac{1}{(2\pi)^{n/2}|\mathbf{\Sigma}|^{1/2}}e^{-\frac{1}{2}(\mathbf{x}-\boldsymbol{\mu})^\mathsf{T}\mathbf{\Sigma}^{-1}(\mathbf{x}-\boldsymbol{\mu})}

其中,\mathbf{x}是n维数据向量,\boldsymbol{\mu}是分布的均值向量,\mathbf{\Sigma}是分布的协方差矩阵。

最大似然估计也可以用于估计多元高斯分布的参数。似然函数为:

L(\boldsymbol{\mu}, \mathbf{\Sigma}) = \prod_{i=1}^n f(\mathbf{x}_i) = \left(\frac{1}{(2\pi)^{n/2}|\mathbf{\Sigma}|^{1/2}}\right)^n e^{-\frac{1}{2}\sum_{i=1}^n (\mathbf{x}_i-\boldsymbol{\mu})^\mathsf{T}\mathbf{\Sigma}^{-1}(\mathbf{x}_i-\boldsymbol{\mu})}

求解似然函数的一阶偏导数并将其置零,我们可以得到\boldsymbol{\mu}\mathbf{\Sigma}的估计值:

\hat{\boldsymbol{\mu}} = \frac{1}{n}\sum_{i=1}^n \mathbf{x}_i
\hat{\mathbf{\Sigma}} = \frac{1}{n}\sum_{i=1}^n (\mathbf{x}_i-\hat{\boldsymbol{\mu}})(\mathbf{x}_i-\hat{\boldsymbol{\mu}})^\mathsf{T}

总结

最大似然估计是一种用于估计统计模型参数的方法。它是基于这样一个原理:模型参数的值应使模型的似然函数最大化。

最大似然估计可以用于估计一元高斯分布和多元高斯分布的参数。