YOLOv3 是由 Joseph Redmon 和 Ali Farhadi 提出的单阶段检测器, 该检测 器与达到同样精度的传统目标检测方法相比,推断速度能达到接近两倍.
PaddleDetection实现版本中使用了 Bag of Freebies for Training Object Detection Neural Networks 中提出的图像增强和label smooth等优化方法,精度优于darknet框架的实现版本,在COCO-2017数据集上,YOLOv3(DarkNet)达到mAP(0.50:0.95)= 38.9
的精度,比darknet实现版本的精度(33.0)要高5.9。同时,在推断速度方面,基于Paddle预测库的加速方法,推断速度比darknet高30%。
在此基础上,PaddleDetection对YOLOv3进一步改进,得到了更大的精度和速度优势。
将YOLOv3骨架网络更换为ResNet50-vd,同时在最后一个Residual block中引入Deformable convolution v2(可变形卷积)替代原始卷积操作。另外,使用object365数据集训练得到的模型作为coco数据集上的预训练模型,进一步提高YOLOv3的精度。
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
python tools/train.py -c configs/dcn/yolov3_r50vd_dcn.yml
更多模型参数请使用python tools/train.py --help
查看,或参考训练、评估及参数说明文档
模型 | 预训练模型 | 验证集 mAP | P4预测速度 | 下载 |
---|---|---|---|---|
YOLOv3 DarkNet | DarkNet pretrain | 38.9 | 原生:88.3ms tensorRT-FP32: 42.5ms |
下载链接 |
YOLOv3 ResNet50_vd dcn | ImageNet pretrain | 39.1 | 原生:74.4ms tensorRT-FP32: 35.2ms |
下载链接 |
YOLOv3 ResNet50_vd dcn | Object365 pretrain | 41.4 | 原生:74.4ms tensorRT-FP32: 35.2ms |
下载链接 |