YOLO系列算法v1-v7的之路(更新中...)

发布网友 发布时间:2024-10-24 17:28

我来回答

1个回答

热心网友 时间:2024-10-29 21:00

YOLO系列算法自推出以来,因其速度快、精度高和部署方便的特点,在多个领域得到广泛应用。本文将简要概述YOLOv1-v4的发展历程,并针对v5-v7进行深入剖析,以理解其深层算法原理及改进策略。

1. YOLO V1

Paper下载地址:You Only Look Once:Unified, Real-Time Object Detection 代码复现:github.com/U-zzd/yolov1...

YOLO V1采用卷积神经网络直接实现检测过程,将Faster-RCNN的候选区和对象识别两个阶段合二为一,分为3个步骤。主要流程如图1所示:

1.1 模型结构

1.2 网络结构

整个网络包括24个卷积层和2个全连接层,其中卷积层的前20层是修改后的GoogLeNet。网络经过最后一个全连接层得到一个1470×1的输出,7×7×30的一个张量,即每个网格都有一个30维的输出,代表预测结果。以PASCAL VOC数据集为例,总共包含20个类别,即30=(5*2+20)。2个Bounding Box,一个预测大目标,一个预测小目标。

1.3 损失函数

1.4 V1的优点

1.5 YOLO系列比较

在YOLO v1的模型中,检测头就是最后的2个全连接层(Linear in PyTorch),它们是参数量最大的2个层,也是最值得改进的2个层。后面的YOLO模型都对这里进行改进:YOLO v1一共预测49个目标,一共98个框。

2. YOLO V2

paper地址:YOLO9000:Better, Faster, Stronger

YOLOv2是YOLO系列的第二代模型,首次使用基于锚框进行检测,并提出多尺度训练等方法,为后续的YOLOv3、YOLOv4、YOLOv5、PPYOLO奠定了基础。

2.1 V1的缺点

2.2 网络结构

2.3 Backbone:Darknet-19

为了进一步提升性能,YOLO v2重新单独训练了一个Darknet-19作为Backbone,是按照分类网络去train的,用的数据集是imagenet,是1000个classes,所以最后加了一个softmax层,使用cross entropy loss。如下图5所示:

2.4 引入Batch Normalization

2.5 引入Anchor Box机制

YOLO v1直接回归(x,y,w,h)范围比较大,预测框准确率低,现在想预测一个偏移量,来增加对预测框回归的准确度。Anchor可以把它理解为一个预先定义好的框,它的位置、宽高都是已知的,是一个参照物,供我们预测时参考。基于anchor的偏移量的意思是,anchor的位置是固定的,偏移量=目标位置-anchor的位置。

2.6 预测结果的改变

YOLO V2每个网格有5个anchor,生成5个预测框,每个预测框都会有一个类别预测概率:输出格式为[N, 13, 13, 125],125 = 5 x 5(c, x, y, w, h) + 5 x 20(classes)。

2.7 细粒度特征

2.8 损失函数

2.9 YOLO系列比较

3. YOLO V3

paper地址:YOLOv3: An Incremental Improvement

3.1 V2的缺点

3.2 网络结构

3.3 Backbone:Darknet-53

YOLOv3将原来的Darknet-19改进为Darknet-53。主要由1×1和3×3的卷积层组成,每个卷积层之后包含一个批量归一化层和一个Leaky ReLU,加入这两个部分的目的是为了防止过拟合。卷积层、批量归一化层以及Leaky ReLU共同组成Darknet-53中的基本卷积单元CBL(Conv+BN+Leaky relu)。因为在Darknet-53包含53个这样的DBL,所以称其为Darknet-53。

相比于Darknet-19的改进:

3.4 Neck:FPN

3.5 Yolo Head

每一个尺度网格都负责预测3个边界框,且COCO数据集有80个类。所以网络单个尺度的输出张量应该是:

N ×N ×[3∗(4+1+80)]

3.6 损失函数

3.7 YOLO系列比较

4. YOLO V4

paper地址:arxiv.org/pdf/2004.1093...

4.1 网络结构

4.2 Input端

4.3 BackBone

4.4 Neck:FPN+PAN

4.5 Yolo Head

4.6 损失函数

4.7 YOLO系列比较

5. YOLO X

paper地址:https://arxiv.org/abs/2107.0843

6. YOLO V5

paper地址:

7. YOLO V6

paper地址:

8. YOLO V7

paper地址:

一篇搞定目标检测YOLO v1到YOLO X算法(附代码+数据集) 目标检测--YOLO v1 论文阅读笔记(附代码) 你一定从未看过如此通俗易懂的YOLO系列(从V1到V5)模型解读! 目标检测YOLO系列算法精讲:从yolov1至yolov4的进阶之路(呕心沥血2万字超全整理,建议收藏!)_源代码杀手的博客-CSDN博客_yolo系列 对比 目标检测--YOLO v3论文阅读笔记 江大白:深入浅出Yolo系列之Yolov3&Yolov4&Yolov5&Yolox核心基础知识完整讲解 修仙:YOLOv1 损失函数代码详解(pytorch)

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com