返回
一图看懂机器学习中 TP、TN、FP、FN、F1、TPR、FPR
人工智能
2023-10-28 20:59:59
TP、TN、FP、FN、F1、TPR、FPR:一图秒懂
机器学习中的二分类
在机器学习的二分类问题中,我们有一个包含正例和负例的数据集。分类模型的任务是根据输入数据预测每个样本的类别(正例或负例)。
混淆矩阵
混淆矩阵是一个表格,用于总结分类模型的预测结果。它包含以下四个值:
- 真阳性 (TP): 模型正确预测为正例的正例数。
- 真阴性 (TN): 模型正确预测为负例的负例数。
- 假阳性 (FP): 模型错误预测为正例的负例数,又称 Type I 错误。
- 假阴性 (FN): 模型错误预测为负例的正例数,又称 Type II 错误。
性能指标
基于混淆矩阵,我们可以计算出以下性能指标:
准确率 (ACC)
ACC = (TP + TN) / (TP + TN + FP + FN)
准确率表示模型正确预测样本的比例。
灵敏度 (TPR) 或召回率
TPR = TP / (TP + FN)
灵敏度表示模型识别正例的能力。
特异度 (TNR)
TNR = TN / (TN + FP)
特异度表示模型识别负例的能力。
F1 分数
F1 = 2 * (TPR * TNR) / (TPR + TNR)
F1 分数是一个综合指标,同时考虑了灵敏度和特异度。
一图看懂
图片:一图看懂 TP、TN、FP、FN、F1、TPR、FPR
示例
假设我们有一个数据集,其中正例数为 100,负例数为 200。我们训练了一个分类模型,并得到了以下混淆矩阵:
预测值 | 实际值 |
---|---|
正例 | 80 (TP) |
负例 | 20 (FN) |
指标计算:
- ACC = (80 + 90) / (80 + 90 + 10 + 20) = 0.85
- TPR = 80 / (80 + 20) = 0.8
- TNR = 90 / (90 + 10) = 0.9
- F1 = 2 * (0.8 * 0.9) / (0.8 + 0.9) = 0.85
结论
TP、TN、FP、FN、F1、TPR 和 FPR 是衡量机器学习分类模型性能的重要指标。通过理解这些指标的含义,我们可以对模型的优缺点有更深入的了解。