对象检测是一项计算机视觉任务,主要是识别和定位图像或视频中的对象。它是许多应用程序的重要组成部分,例如监控、自动驾驶汽车或机器人技术。而根据同一输入图像通过网络的次数,目标检测算法大致分为两类。
单次目标检测
单次对象检测使用输入图像的单次传递来预测图像中对象的存在和位置。它一次处理整个图像,从而提高计算效率。
然而,单次目标检测通常不如其他方法准确,并且在检测小物体方面效果较差。此类算法可用于在资源受限的环境中实时检测对象。
两次目标检测
两次目标检测使用两次输入图像来预测物体的存在和位置。第一遍用于生成一组建议或潜在对象位置,第二遍用于提炼这些建议并做出最终预测。这种方法比单次目标检测更准确,但计算成本也更高。
总的来说,单次和两次目标检测之间的选择取决于应用程序的具体要求和约束。
通常,单次目标检测更适合实时应用,而两次目标检测更适合精度更重要的应用。
对象检测模型性能评估指标
为了确定和比较不同对象检测模型的预测性能,我们需要标准的定量指标。
两个最常见的评估指标是并集交集(IoU)和平均精度(AP)指标。
并集交集(IoU)
IoU(Intersection over Union)是一种流行的度量标准,用于测量定位精度和计算目标检测模型中的定位误差。
为了计算预测边界框和真实边界框之间的IoU,我们首先获取同一对象的两个相应边界框之间的交叉区域。在此之后,我们计算两个边界框覆盖的总面积——也称为“并集”,以及它们之间的重叠区域称为“交集”。
交集除以Union给出了重叠与总面积的比率,可以很好地估计预测边界框与原始边界框的接近程度。
平均精度(AP)
平均精度(AP)计算为一组预测的精度与召回曲线下的面积。
召回率计算为模型在某个类别下所做的总预测与该类别的现有标签总数的比率。精度是指真实阳性与模型做出的总预测的比率。
召回率和精度提供了一种权衡,通过改变分类阈值以图形方式表示为曲线。该精度与召回率曲线下的面积为我们提供了模型每个类别的平均精度。该值在所有类别中的平均值称为平均精度(mAP)。