Python中五大强悍概率分布的实现指南

2023-11-04 14:38:00

正态分布

正态分布，也称为高斯分布，是统计学中最为著名的概率分布之一。它在自然界和社会科学中有着广泛的应用，如预测股票价格走势、模拟人体测量数据等。

在Python中，我们可以使用NumPy库中的scipy.stats.norm函数来实现正态分布。该函数的语法如下：

scipy.stats.norm(loc, scale)

其中，loc是正态分布的均值，scale是正态分布的标准差。

例如，要生成一个均值为0，标准差为1的正态分布，我们可以使用以下代码：

import scipy.stats as stats
import numpy as np

dist = stats.norm(0, 1)

# 生成100个正态分布随机数
samples = dist.rvs(100)

# 绘制正态分布的概率密度函数
plt.plot(samples, stats.norm.pdf(samples))
plt.show()

输出结果如下图所示：

[图片]

2. 二项分布

二项分布是重复实验中成功次数的概率分布。它在统计学中有着广泛的应用，如计算产品合格率、预测选举结果等。

在Python中，我们可以使用NumPy库中的scipy.stats.binom函数来实现二项分布。该函数的语法如下：

scipy.stats.binom(n, p)

其中，n是重复实验的次数，p是每次实验成功的概率。

例如，要生成一个重复10次实验，每次实验成功概率为0.5的二项分布，我们可以使用以下代码：

import scipy.stats as stats
import numpy as np

dist = stats.binom(10, 0.5)

# 生成100个二项分布随机数
samples = dist.rvs(100)

# 绘制二项分布的概率密度函数
plt.plot(samples, stats.binom.pmf(samples, 10, 0.5))
plt.show()

输出结果如下图所示：

[图片]

3. 泊松分布

泊松分布是随机事件在一定时间或空间内发生的次数的概率分布。它在统计学中有着广泛的应用，如计算电话呼叫中心接到的电话数量、预测交通事故发生的数量等。

在Python中，我们可以使用NumPy库中的scipy.stats.poisson函数来实现泊松分布。该函数的语法如下：

scipy.stats.poisson(mu)

其中，mu是泊松分布的均值。

例如，要生成一个均值为5的泊松分布，我们可以使用以下代码：

import scipy.stats as stats
import numpy as np

dist = stats.poisson(5)

# 生成100个泊松分布随机数
samples = dist.rvs(100)

# 绘制泊松分布的概率密度函数
plt.plot(samples, stats.poisson.pmf(samples, 5))
plt.show()

输出结果如下图所示：

[图片]

4. 指数分布

指数分布是描述随机事件发生的时间间隔的概率分布。它在统计学中有着广泛的应用，如计算客户等待时间、预测机器故障的时间等。

在Python中，我们可以使用NumPy库中的scipy.stats.expon函数来实现指数分布。该函数的语法如下：

scipy.stats.expon(scale)

其中，scale是指数分布的均值。

例如，要生成一个均值为1的指数分布，我们可以使用以下代码：

import scipy.stats as stats
import numpy as np

dist = stats.expon(1)

# 生成100个指数分布随机数
samples = dist.rvs(100)

# 绘制指数分布的概率密度函数
plt.plot(samples, stats.expon.pdf(samples, 1))
plt.show()

输出结果如下图所示：

[图片]

5. 均匀分布

均匀分布是描述随机事件在某个范围内均匀分布的概率分布。它在统计学中有着广泛的应用，如生成随机数、模拟实验数据等。

在Python中，我们可以使用NumPy库中的scipy.stats.uniform函数来实现均匀分布。该函数的语法如下：

scipy.stats.uniform(loc, scale)

其中，loc是均匀分布的下限，scale是均匀分布的上限。

例如，要生成一个下限为0，上限为1的均匀分布，我们可以使用以下代码：

import scipy.stats as stats
import numpy as np

dist = stats.uniform(0, 1)

# 生成100个均匀分布随机数
samples = dist.rvs(100)

# 绘制均匀分布的概率密度函数
plt.plot(samples, stats.uniform.pdf(samples, 0, 1))
plt.show()