目标检测模型在物体检测中的运用与实践(2) 损失函数

2024-01-12 01:37:14

我们来简单回顾一下 YOLOv1 的损失函数，它包含如下几部分：

分类损失：分类损失预测框与真实框的分类错误程度，交叉熵损失函数通常用于分类问题。在目标检测任务中，每个预测框都需要预测出与其相交的物体种类。为了衡量预测结果和真实结果之间的差异，YOLOv1采用了交叉熵损失函数来计算分类损失。
坐标损失：坐标损失预测框与真实框的偏差程度，预测框的中心点与真实框的中心点之间的距离是计算坐标损失的一个常见方式。YOLOv1采用平方和误差函数来计算坐标损失，该函数对预测框与真实框之间的差异进行求和，然后除以预测框与真实框的面积。
置信度损失：置信度损失用于惩罚那些与真实框交并比低的预测框。置信度损失的计算方式与分类损失类似，但权重更大。这样可以使模型更加关注与真实框相交较多的预测框，减少误检。

在实践中，YOLOv1的损失函数可以表示为以下公式：

L = \lambda_{coord} \sum_{i=0}^{S^2} \sum_{j=0}^{B} 1_{ij}^{\text{obj}}[(x_i - \hat{x}_i)^2 + (y_i - \hat{y}_i)^2] +

+ \lambda_{coord} \sum_{i=0}^{S^2} \sum_{j=0}^{B} 1_{ij}^{\text{obj}}[(\sqrt{w_i} - \sqrt{\hat{w}_i})^2 + (\sqrt{h_i} - \sqrt{\hat{h}_i})^2] +

+ \sum_{i=0}^{S^2} \sum_{j=0}^{B} 1_{ij}^{\text{obj}} (C_i - \hat{C}_i)^2 +

+ \lambda_{\text{noobj}} \sum_{i=0}^{S^2} \sum_{j=0}^{B} 1_{ij}^{\text{noobj}} (C_i - \hat{C}_i)^2

其中，\lambda_{coord}和\lambda_{\text{noobj}}是超参数，用来平衡不同损失项的权重。$1_{ij}^{\text{obj}}和$1_{ij}^{\text{noobj}}是指示函数，分别表示预测框与真实框是否相交。x_i,y_i,w_i和h_i是真实框的中心点坐标和宽高。\hat{x}_i,\hat{y}_i,\hat{w}_i和\hat{h}_i是预测框的中心点坐标和宽高。C_i和\hat{C}_i是真实框和预测框的类别概率分布。