目标检测损失函数的定义及计算实现

释放双眼,带上耳机,听听看~!
本文介绍了目标检测损失函数的定义及计算实现,详细解释了IoU家族代码的实现和计算结果,并提供了相关的代码和示意图。

前言

  损失函数常见于目标检测任务中,其解决问题的效率十分依赖定义的损失函数。关于目标检测损失函数的定义基本可以认定为依赖于边界框回归指标的聚合,例如预测框和真实框(即 GIoU、CIoU、DIoU 等)的距离、重叠区域和纵横比。

  在本文中我们着重点将放在代码实现以及结果展示,关于原理部分大家可自行查阅论文以及相关的论文讲解,我在这里就不过多的炒冷饭了,望海涵!

计算实现

IoU家族代码实现

  关于IoU、GIoU、DIoU和CIoU的代码实现摘录于互联网。结合计算部分的代码采用如图(w=h=300,c=3)进行实验:我们在标注软件上标定企鹅的鼻子部分,标签文件存储为Voc格式,查阅xml文件得到企鹅鼻子(目标位置)的[xmin,ymin,xmax,yxmax]=[105, 100, 195, 133],易得标注框的 w= 90,h=33。

                目标检测损失函数的定义及计算实现

  为了计算的便捷性以及iou贴合度,我们将设定预测框的大小等同于真实目标框,也即 W真 = W 预 & H真 = H预。采用滑动框的方式在图像上进行滑动计算(STEP=1),动图如下:绿色框为目标位置,紫色框为滑动框也就是预测框。

                目标检测损失函数的定义及计算实现

计算结果

  计算每一步得到的“iou”值得到如下图,其中在计算iou时出现了负数,我分别将负数未置零以及负数置零绘制了一遍供大家参考。
图像排列顺序为:左上=IOU 右上=GIOU 左下=DIOU 右下=CIOU

未置零图

目标检测损失函数的定义及计算实现目标检测损失函数的定义及计算实现

目标检测损失函数的定义及计算实现目标检测损失函数的定义及计算实现

置零图

目标检测损失函数的定义及计算实现目标检测损失函数的定义及计算实现

目标检测损失函数的定义及计算实现目标检测损失函数的定义及计算实现

IOU代码

import math
from mpmath import eps
from numpy import where, arcsin


def euclidean_distance(p1, p2):
    """计算两个点的欧式距离"""
    x1, y1 = p1
    x2, y2 = p2
    return math.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)


class BBox(object):
    def __init__(self, x, y, r, b):
        self.x, self.y, self.r, self.b = x, y, r, b

    def __xor__(self, other):
        """计算box和other的IoU"""
        cross = self & other
        union = self | other
        return cross / (union + 1e-6)

    def __or__(self, other):
        """ 计算box和other的并集"""
        cross = self & other
        return self.area + other.area - cross

    def __and__(self, other):
        """计算box和other的交集"""
        xmax = min(self.r, other.r)
        ymax = min(self.b, other.b)
        xmin = max(self.x, other.x)
        ymin = max(self.y, other.y)
        return BBox(xmin, ymin, xmax, ymax).area

    def boundof(self, other):
        """计算box和other的边缘外包框,使得2个box都在框内的最小矩形"""
        xmin = min(self.x, other.x)
        ymin = min(self.y, other.y)
        xmax = max(self.r, other.r)
        ymax = max(self.b, other.b)
        return BBox(xmin, ymin, xmax, ymax)

    def center_distance(self, other):
        """计算两个box的中心点距离"""
        return euclidean_distance(self.center, other.center)

    def bound_diagonal_distance(self, other):
        """计算两个box的bound的对角线距离"""
        bound = self.boundof(other)
        return euclidean_distance((bound.x, bound.y), (bound.r, bound.b))

    @property
    def center(self):
        return (self.x + self.r) / 2, (self.y + self.b) / 2

    @property
    def area(self):
        return self.width * self.height

    @property
    def width(self):
        # todo 如果不考虑右侧的一个像素 返回 self.r - self.x
        return self.r - self.x + 1

    @property
    def height(self):
        # todo 如果不考虑下侧的一个像素 返回 self.b - self.y
        return self.b - self.y + 1

    def __repr__(self):
        return f"{self.x}, {self.y}, {self.r}, {self.b}"


def IoU(box1: BBox, box2: BBox):
    return box1 ^ box2


def GIoU(box1: BBox, box2: BBox):
    bound_area = box1.boundof(box2).area
    union_area = box1 | box2
    return IoU(box1, box2) - (bound_area - union_area) / bound_area


def DIoU(box1: BBox, box2: BBox):
    d = box1.center_distance(box2)
    c = box1.bound_diagonal_distance(box2)
    return IoU(box1, box2) - d ** 2 / c ** 2


def CIoU(box1: BBox, box2: BBox):
    diou = DIoU(box1, box2)

    v = 4 / (math.pi ** 2) * (math.atan(box1.width / box1.height) - math.atan(box2.width / box2.height)) ** 2
    iou = IoU(box1, box2)
    alpha = v / (1 - iou + v)
    return diou - alpha * v

拓展

  大家可以通过本文的计算方法结合自己的项目中IOU计算方式进行替换更改或结合项目做适合自己项目的IOU。本人能力有限,路过的各位大神若发现纰漏的地方还望指教一二!感谢!希望本文能够帮助到大家。

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

语言模型和预训练:从统计到神经网络

2023-12-16 7:54:14

AI教程

DS-1000:数据科学领域的新NL2Code数据集发布

2023-12-16 9:19:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索