旋转标注图片，扩大数据量，提升检测模型效果

人工智能

2023-09-21 10:37:28

图片标注是计算机视觉领域的基石任务，而Labelme是一款广泛使用的图像标注工具。为了提升标注数据的质量和覆盖度，本文提出了一种通过旋转图像来扩充标注数据的方法。

图像旋转的必要性

在现实世界中，物体可以呈现出各种角度。如果仅使用单一角度的标注数据，训练出的检测模型可能会对其他角度的物体检测能力较弱。如下图所示，如果我们仅标注了机头朝下的飞机，那么模型可能难以检测到机头朝上的飞机。

飞机图像的旋转示例

通过旋转图像，我们可以轻松地生成具有不同角度的图像，从而丰富数据集并减少标注工作量。

如何旋转图像

SciPy库为图像旋转提供了强大的功能。我们可以使用scipy.ndimage.rotate函数来旋转图像。

import scipy.ndimage

# 读取图像
image = cv2.imread("image.jpg")

# 旋转图像90度
rotated_image = scipy.ndimage.rotate(image, 90)

重新计算标注点

旋转图像后，我们需要重新计算标注点的坐标。我们可以使用rotate_points函数来实现这一功能。

def rotate_points(points, angle):
    """
    旋转标注点。

    Args:
        points (numpy.ndarray): 标注点坐标。
        angle (float): 旋转角度（弧度）。
    """

    # 旋转矩阵
    rotation_matrix = cv2.getRotationMatrix2D((0, 0), angle, 1)

    # 旋转标注点
    rotated_points = cv2.transform(points, rotation_matrix)

    return rotated_points

扩充标注数据

有了旋转图像和重新计算标注点的能力，我们可以轻松地扩充标注数据。

# 创建一个空列表来存储旋转后的图像和标注点
rotated_images = []
rotated_annotations = []

# 旋转原始图像和标注点
for image, annotation in zip(images, annotations):
    for angle in angles:
        rotated_image = scipy.ndimage.rotate(image, angle)
        rotated_annotation = rotate_points(annotation, angle)

        rotated_images.append(rotated_image)
        rotated_annotations.append(rotated_annotation)