软NMS：一种新的非极大值抑制方法

人工智能

2023-07-12 01:51:35

Softer-NMS：一种更好的 NMS 方法

NMS 的局限性

在目标检测中，NMS（非极大值抑制）是一种常见技术，用于消除重叠的边界框，提高模型的准确性。然而，传统 NMS 方法存在一些缺点：

抑制真实边界框： 可能会抑制与其他边界框重叠较大的真实边界框。
产生不连续边界框： 可能会产生不连续的边界框，因为相邻的边界框可能会被抑制。

Softer-NMS 的优势

Softer-NMS 是一种新的 NMS 方法，旨在解决这些问题。它通过对边界框进行加权，使其与其他边界框的重叠程度更小，从而减少误检。具体来说，它的工作原理如下：

对所有边界框按置信度从高到低排序。
计算每个边界框与其他所有边界框的重叠面积。
将每个边界框的置信度乘以一个衰减因子，该因子与该边界框与其他所有边界框的重叠面积成正比。
再次按置信度对所有边界框排序。
选择置信度最高的边界框作为最终检测结果。

Softer-NMS 具有以下优点：

减少误检： 通过加权边界框，Softer-NMS 避免抑制一些真实的边界框。
产生连续边界框： 通过保留相邻边界框，Softer-NMS 产生连续的边界框。
提高性能： Softer-NMS 已被证明可以提高目标检测模型的准确性，在一些数据集上，平均精度提高了 1% 以上。

Softer-NMS 的局限性

然而，Softer-NMS 也有其局限性：

增加计算时间： Softer-NMS 需要计算每个边界框与其他所有边界框的重叠面积，这可能增加计算时间。
可能无法消除所有误检： Softer-NMS 可能无法完全消除误检，因为一些真实的边界框仍然可能与其他边界框重叠较大。

代码示例

import numpy as np

def softer_nms(bboxes, scores, overlap_threshold=0.5):
    """
    执行 Softer-NMS。

    参数：
        bboxes (np.ndarray): 候选边界框，形状为 [N, 4]。
        scores (np.ndarray): 候选边界框的分数，形状为 [N]。
        overlap_threshold (float): 抑制边界框的重叠阈值。

    返回：
        np.ndarray: 最终的检测结果，形状为 [M, 4]。
    """

    # 按分数对边界框排序
    sorted_indices = np.argsort(scores)[::-1]
    bboxes = bboxes[sorted_indices]

    # 初始化最终的检测结果
    final_bboxes = []

    # 遍历排序后的边界框
    while bboxes.shape[0] > 0:
        # 获取置信度最高的边界框
        best_bbox = bboxes[0]

        # 添加到最终的检测结果
        final_bboxes.append(best_bbox)

        # 计算与最佳边界框重叠的边界框
        overlapping_bboxes = bboxes[bboxes[:, 0] > best_bbox[0] - overlap_threshold * (best_bbox[2] + best_bbox[3])]
        overlapping_bboxes = overlapping_bboxes[overlapping_bboxes[:, 1] > best_bbox[1] - overlap_threshold * (best_bbox[2] + best_bbox[3])]
        overlapping_bboxes = overlapping_bboxes[overlapping_bboxes[:, 2] < best_bbox[0] + overlap_threshold * (best_bbox[2] + best_bbox[3])]
        overlapping_bboxes = overlapping_bboxes[overlapping_bboxes[:, 3] < best_bbox[1] + overlap_threshold * (best_bbox[2] + best_bbox[3])]

        # 计算重叠面积
        overlap_areas = intersection_over_union(best_bbox, overlapping_bboxes)

        # 加权边界框的分数
        overlapping_bboxes[:, 4] *= np.exp(-overlap_areas / overlap_threshold)

        # 按权重分数对边界框重新排序
        overlapping_bboxes = overlapping_bboxes[np.argsort(overlapping_bboxes[:, 4])[::-1]]

        # 删除已抑制的边界框
        bboxes = overlapping_bboxes

    return np.array(final_bboxes)

结论

Softer-NMS 是一种有效且高效的 NMS 方法，可以提高目标检测模型的准确性。它通过减少误检和产生连续的边界框来克服传统 NMS 方法的缺点。虽然 Softer-NMS 可能需要比传统 NMS 更长的计算时间，但它对目标检测性能的改善使其成为一个有价值的替代方案。

常见问题解答

Softer-NMS 是如何减少误检的？
通过加权边界框，Softer-NMS 避免抑制与其他边界框重叠较大的真实边界框。
Softer-NMS 是如何产生连续边界框的？
通过保留相邻边界框，Softer-NMS 产生连续的边界框。
Softer-NMS 比传统 NMS 的准确性更高吗？
是的，Softer-NMS 通常比传统 NMS 的准确性更高，在一些数据集上，平均精度提高了 1% 以上。
Softer-NMS 的计算成本是多少？
Softer-NMS 的计算成本高于传统 NMS，因为它需要计算每个边界框与其他所有边界框的重叠面积。
Softer-NMS 的一个潜在缺点是什么？
Softer-NMS 可能无法消除所有误检，因为一些真实的边界框仍然可能与其他边界框重叠较大。

Kyle

探索Web开发资源和人工智能教程的代码社区

联系我

扫码关注微信公众号

软NMS：一种新的非极大值抑制方法

Kyle

Pandas AI：解锁 Python 数据分析的新境界

AI无限遐想，与次元壁之间的羁绊

机器人订餐新体验：尝鲜人工智能的无限可能性

水果店老板如何用贝叶斯公式精准预测顾客购买水果的种类？

拯救内存与磁盘：减轻Stable Diffusion模型的负担