Categories
程式開發

YOLOv5 对决 Faster RCNN,谁赢谁输?


YOLOv5 在深度学习社区炒得沸沸扬扬。最近有篇博文是如此介绍 YOLOv5 的:它是最先进的目标检测项目,FPS 高达 140。这一言论,立即在 Hacker News、Reddit 甚至 GitHub 上引起了轩然大波,但这场广泛的讨论并非因为它的推理速度。在这场讨论中,有两个突出问题:1、该模型是否应称为 YOLO;2、速度基准测试结果的准确性和可重复性如何。如果你对该篇博文发布主体 Roboflow的回应感兴趣,可以在这里查看详情。

撇开所有争议不谈,YOLOv5 看起来是一个“很有前途”的模型。因此,我将它与 Faster RCNN 进行了比较,Faster RCNN 是最好的 two stage 检测器之一。为了进行比较,我选取了三段背景不同的视频,并将这两个模型并排运行。我的评估包括对结果质量和推理速度的观察结果。那么,让我们言归正传。

YOLOv5 模型

YOLOv5 的实现是在 PyTorch 中完成的,与之前基于 DarkNet 框架的开发形成了鲜明的对比。这使得该模型的理解、训练和部署变得更加容易(目前暂时没有使用 YOLO-v5 的论文发表)。以我的理解来看,在架构上,它和 YOLO-v4 很相似。一个不同之处可能是使用了 Cross Stage Partial Network(CSP)来降低计算成本。目前尚不清楚 YOLOv5 的运行速度是否比 YOLO-v4 更快,但我更喜欢 PyTorch 的实现,而且让惊讶的是,使用这个模型进行训练是如此的容易。就我个人经验而言,通过它进行推理的体验也是如此。

原文链接:【https://www.infoq.cn/article/3WHu6zGDZMz159Si1ytm】。未经作者许可,禁止转载。