常用的目标检测算法有哪些?科普速度最快的目标检测算法

发布:2022-11-03 15:45:28
阅读:4475
作者:网络整理
分享:复制链接

YOLO算法

YOLO全称You Only Look Once,你只需要看一次,它是当下非常流行的实时对象检测算法。最初的YOLO于2016年首次发布,至今已经发布了多个YOLO版本,每个版本的性能和效率都有显著提高。

YOLO v4是YOLO v3的改进版本,主要是马赛克数据增强、自我对抗训练和交叉小批量标准化。YOLO v7是用于计算机视觉任务的最快、最准确的实时对象检测算法。

SSD算法

SSD全称Single Shot MultiBox Detector,是一种流行的单次检测算法,可以预测多个类别。

该算法使用单个深度神经网络来检测图像中的对象,方法是将边界框的输出空间离散为一组具有不同纵横比和每个特征图位置比例的默认框。对象检测器为每个默认框中每个对象类别的存在生成分数,并调整该框以更好地适应对象形状。此外,SSD还结合了不同分辨率的多个特征图的预测来处理不同大小的对象。

SSD检测器易于训练并集成到需要对象检测组件的软件系统中。与其他单次检测算法相比,SSD具有更好的精度。

R-CNN

基于区域的卷积神经网络是将深度模型应用于对象检测,算法首先从图像中选择几个区域,然后标记它们的类别和边界框。而这些标签是根据程序预定义类创建的。然后,我们就能使用卷积神经网络执行前向计算,开始从每个区域中提取特征。

在R-CNN中,首先将输入的图像划分为近两千个区域部分,然后对每个区域分别应用卷积神经网络。计算区域的大小,并将正确的区域插入到神经网络中。

因此,与YOLO算法相比,训练时间要长得多。

Fast R-CNN

在2015年,在R-CNN的基础上开发了Fast R-CNN。与原始R-CNN独立计算2000个区域不同,Fast R-CNN是在整个图像上运行一次神经网络。这与YOLO算法的架构非常相似,而且运用了感兴趣区域池化的办法,从网络的输出张量中切出每个感兴趣区域,对其进行整形和分类。这使得Fast R-CNN比原始R-CNN更准确。

Mask R-CNN

Mask R-CNN是Fast R-CNN的一个进步。两者的区别在于,Mask R-CNN与现有的边界框识别分支并行增加了一个预测对象掩码的分支。Mask R-CNN训练更加简单,而且可以以5fps的速度运行。

SqueezeDet

SqueezeDet是2016年发布的用于计算机视觉的深度神经网络的名称。SqueezeDet专为自动驾驶而开发,它使用计算机视觉技术执行对象检测。和YOLO算法一样,它是一种单次检测器算法。在SqueezeDet中,卷积层仅用于提取特征图,还用作计算边界框和类概率的输出层。SqueezeDet模型的检测流水线仅包含神经网络的单个前向传递,使其速度极快。

MobileNet

MobileNet是用于运行对象检测任务的单次多框检测网络。该模型是使用Caffe框架实现的。

YOLOR

YOLOR是2021年推出的一种新型物体检测器。该算法将隐式和显式知识同时应用于模型训练。因此,YOLOR可以学习一个通用表示,并通过这个通用表示完成多项任务。隐性知识通过核空间对齐、预测细化和多任务学习集成到显性知识中。

通过这种方法,YOLOR实现了大大提高的目标检测性能结果。与COCO数据集基准上的其他目标检测方法相比,在相同的推理速度下,YOLOR的MAP比PP-YOLOv2高3.8%。与Scaled-YOLOv4相比,推理速度提高了88%,使其成为当今最快的实时目标检测器。

扫码进群
微信群
免费体验AI服务