一、关键概念
1. IoU(Intersection over Union)
交并比,它衡量两个边框(或区域)重叠得有多好——也就是预测框与真实框的重合程度,是许多目标检测模型的核心指标之一。
IoU = 交集面积 ÷ 并集面积
具体到算法实现计算:
设预测框为\((x_1^{(p)},y_1^{(p)},x_2^{(p)},y_2^{(p)})\),真实框为\((x_1^{(g)},y_1^{(g)},x_2^{(g)},y_2^{(g)})\)。
则交集坐标:
\[\begin{aligned}
(x_1^{(I)},y_1^{(I)},x_2^{(I)},y_2^{(I)}) = (&\max(x_1^{(p)},x_1^{(g)}), \\
&\max(y_1^{(p)},y_1^{(g)}),\\
&\min(x_2^{(p)},x_2^{(g)}),\\
&\min(y_2^{(p)},y_2^{(g)}))
\end{aligned}
\]
交集和并集面积:
\[A_I=\max(0,x_2^{(I)}-x_1^{(I)})\times \max(0,y_2^{(I)}-y_1^{(I)})
\]
\[A_U=A_p+A_g-A_I
\]
交并比IoU即为:
\[IoU=\frac{A_I}{A_U}
\]
有些模型会使用IoU的改进版本,例如GIoU解决了当两个框不相交时IoU = 0,梯度无法提供有用方向的问题。GIoU在IoU基础上增加了“惩罚框未重叠的距离”,公式为:
\[GIoU = IoU - \frac{| C-(A\cup B) |}{| C |}
\]
其中\(C\)是包含预测框和真值框的最小外接矩形。
