返回

卡方检验和Fisher精确性检验:构建数学建模基础框架

后端

卡方检验和 Fisher 精确性检验:理解统计检验的关键

在数学建模中,数据分析是关键。假设检验是一种用于确定观察到的数据模式是否是随机发生还是实际存在关联的重要技术。在本文中,我们将深入探讨两种广泛使用的假设检验方法:卡方检验和 Fisher 精确性检验。

卡方检验

什么是卡方检验?

卡方检验是一种统计检验方法,用于确定一个分类变量的预期频率和观察到的频率之间是否存在显著差异。简单来说,它可帮助我们确定某些事件发生的频率是否与我们的预期一致。

步骤:

  1. 提出假设: 首先,我们需要提出原假设(预期频率和观察到的频率之间没有差异)和备择假设(存在差异)。
  2. 计算卡方统计量: 这是衡量预期频率和观察到的频率之间差异的量度。
  3. 确定自由度: 自由度表示类别数减去 1。
  4. 查表得到临界值: 这是根据自由度从卡方分布表中获得的值。
  5. 比较统计量和临界值: 如果统计量大于临界值,则拒绝原假设,认为存在差异。

代码示例:

使用 Python 的 scipy 库执行卡方检验:

from scipy.stats import chi2_contingency

observed = [[6, 7, 8, 9, 5, 1],
           [1, 2, 3, 4, 5, 6]]
chi2, p, dof, expected = chi2_contingency(observed)
print("卡方统计量:", chi2)
print("自由度:", dof)
print("p 值:", p)

Fisher 精确性检验

什么是 Fisher 精确性检验?

Fisher 精确性检验是一种假设检验方法,用于确定两个类别变量之间是否相互独立。换句话说,它可以告诉我们两个事件的发生是否相互关联。

步骤:

  1. 提出假设: 与卡方检验类似,我们也需要提出原假设(变量之间相互独立)和备择假设(存在关联)。
  2. 计算联合概率: 这是两个事件同时发生的概率。
  3. 计算各个类别的概率乘积: 这是两个事件独立发生概率的乘积。
  4. 计算 Fisher 精确性检验统计量: 这是联合概率和概率乘积之间的差异。
  5. 查表得到临界值: 这是根据样本量和自由度从 Fisher 精确性分布表中获得的值。
  6. 比较统计量和临界值: 与卡方检验类似,如果统计量大于临界值,则拒绝原假设,认为存在关联。

应用实例

六面骰子示例:

假设我们有一个六面骰子,想要检验它是否公平。使用卡方检验,我们可以比较不同点数的观察到的频率和预期频率(每个点数的频率相同)。如果卡方统计量大于临界值,则表明骰子不公平。

结论

卡方检验和 Fisher 精确性检验是统计学中的重要工具,可帮助我们分析数据并得出有关数据模式的结论。通过理解这些检验方法,我们可以做出更明智的决策并获得对数据更深入的见解。

常见问题解答

  1. 卡方检验和 Fisher 精确性检验有什么区别?

    • 卡方检验用于分类变量的预期频率和观察到的频率之间差异,而 Fisher 精确性检验用于检验两个类别变量之间的独立性。
  2. 如何选择合适的检验方法?

    • 卡方检验适用于较大的样本量,而 Fisher 精确性检验适用于较小的样本量。
  3. 如果卡方统计量小于临界值,意味着什么?

    • 表明观察到的频率和预期频率之间没有显著差异。
  4. Fisher 精确性检验的优点是什么?

    • 不需要假设样本来自正态分布。
  5. 假设检验的局限性是什么?

    • 假设检验的可靠性取决于数据的质量和样本量的代表性。