问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
你好,欢迎来到懂视!登录注册
当前位置: 首页 - 正文

RT-DETR:又快又好的ViT系列模型,拉开ViT实时化的序幕!

发布网友 发布时间:2024-10-19 19:42

我来回答

1个回答

热心网友 时间:2024-12-02 09:21

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>>

在本项目之前,我发布过一个项目名为 [AI达人特训营第三期]PPYOLOE遇上ViT助力铁路工人安全作业,感兴趣的小伙伴可以直接点进该链接去查看。在之前的项目中使用的是以 ViT-base 为 backbone 的 PPYOLOE 模型,mAP(0.50, 11point) 能够达到 87.64%,效果还是不错的,但是众所周知,ViT系列模型存在一个问题就是推理时延高,这极大地影响了ViT系列模型的落地应用,这也是我在该项目中提到的需要改进的点。

最近关注到了PaddleDetection新出的RT-DETR模型,根据论文给出的数据,能够达到实时检测的效果,在速度和精度上都超越了YOLO系列模型,我也是迫不及待地实践了一下。

整体情况如下:

单从本项目来看,mAP(0.50, 11point) 提升了 8.62 的百分点,average FPS 提升了 4.4 个点,是一个非常喜人的提升。可以看出RT-DETR在精度和速度上都是有着显著的提升,因此大家也可以在自己的项目中尝试使用这个模型,看看是否能够达到更好的效果。

学习本项目过程中,你可能感兴趣的链接地址:
一、模型简介

RT-DETR由BackBone、混合编码器和带有辅助预测头的Transformer编码器组成。整体结构如下所示(图片来自原论文):

具体来说:

官方数据如下:

以上段落有部分摘自于官方发布的 超越YOLOv8,飞桨推出精度最高的实时检测器RT-DETR!。
二、数据集简介

该数据集用于正确检测工人、他们的反光背心和安全帽。该数据集有3222张图片,其中包含三个标签:工人、反光背心和安全帽。 AI Studio链接

用途举例:

部分数据集图片如下:
三、数据预处理

Step01: 解压数据集

Step02: 将 txt 格式标注文件转换成 xml 格式标注文件,代码如下所示。

Step03: 可视化转换结果,判断转换是否正确,代码如下所示。

部分可视化结果如下:
四、代码实现4.1 检测数据分析

该数据集总共包含 3 个标签,各类标签的数量分别为:

图像尺寸分析: 通过图像尺寸分析,我们可以看到该数据集图片的尺寸,均为 [1920, 1080]。
4.2 安装PaddleDetection4.3 数据集划分

首先安装PaddleX。

然后,我们通过 paddlex 中的 split_dataset 命令按照 0.9:0.1 的比例划分训练集和验证集。
4.4 模型训练

损失函数如图所示:
4.5 模型评估

通过如下命令在单个GPU上评估我们的验证集。

指标如下:

相比 [AI达人特训营第三期]PPYOLOE遇上ViT助力铁路工人安全作业使用的以 ViT-base 为 backbone 的 PPYOLOE 模型,mAP(0.50, 11point) 提升了 8.62 的百分点,average FPS 提升了 4.4 个点。
4.6 模型推理

我们可以通过以下命令在单张GPU上推理文件中的所有图片。

部分可视化结果如下:
4.7 模型导出

Step01. 导出模型

Step02: 转换模型至ONNX

首先安装 Paddle2ONNX 和 ONNX。

然后转换模型。
五、ONNXRUNTIME部署示例

首先安装 ONNXRUNTIME。

接下来是我用 ONNXRUNTIME 写的一个 demo,案例比较简单,大家可以自行了解。在这我就不多赘述了。

可视化结果如下:
六、总结与提高

本项目是使用飞桨团队最新推出的 RT-DETR 模型来实现的。根据论文描述,模型可以达到实时检测的效果,个人认为该模型是 ViT 系列模型所取得的一个重大突破,揭开了 ViT 实时化的序幕。

相比 [AI达人特训营第三期]PPYOLOE遇上ViT助力铁路工人安全作业使用的以 ViT-base 为 backbone 的 PPYOLOE 模型,mAP(0.50, 11point) 提升了 8.62 的百分点,average FPS 提升了 4.4 个点。

大家快来 GitHub 给 PaddleDetection 点个 Star 叭!

如果需要在你的研究中使用RT-DETR,请通过以下方式引用我们的论文:

此文章为搬运 原项目链接
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
申请提交成功什么意思 属猪的上等婚配是哪个 ssm前端页面是jsp还是HTML 地理核心期刊 初中地理老师在哪些期刊发职称论文好? 地理老师评职称发表论文 地理地质专业学术cn期刊杂志投稿 一个内向 自卑 恐男 不敢与男生对视的社恐女生如果被男生堵住欺凌并骚扰... 头部无意识颤抖是怎么回事特别是心里紧张的? 乌龟拉白色长条状的屎 为什么金钱龟拉白色长条的屎 我是中专一年级学生,毕业后能不能和高中生一样参加高考? Tensorrt下部署YOLOv5模型(附代码) 我是一个中专一年级的学生请问一下我可不可以在课余时间里考些什么对... 【模型推理】教你简化 onnx upsample 算子 我中专一年级可以考大学吗也就是六月高考? 我已经读完了高中3年 ONNX再探 震惊!史上最快的实例分割SparseInst Int8量化实录 在ONNX Runtime框架下实现YOLOv8部署:同时支持目标检测和实例分割;还... YOLOv8的ONNX Runtime部署(C++) 有关不想谈恋爱的文案句子(人间情事太俗,不如一人看日出) 安卓智能电视盒子的CPU全志H3瑞星微RK3128这两个CPU哪个更好谁可以对比... 中专毕业后可以参加高考吗? 提问求所有关于三角函数的公式,主要是sec那样的,sin cos tan就不要了... 恶性葡萄胎怎么治疗 葡萄胎治疗原则 葡萄胎的临床表现 完全性葡萄胎怎么办 南方中集有限公司有哪些工种 我打算五一去大连,时间有六天,求帮忙介绍一下大连的旅游景点,吃的特色... ...且离仲裁时间快有六个月了,公司还可以进行申诉或者起诉吗?_百度... 从女人的角度分析,为什么女人更爱外国佬 一个迷茫的大学一年级学生希望大家的帮助 香辣豆干怎么做才下饭? 雪地靴怎么清洗油渍-洗雪地靴小窍门 香辣豆腐干怎么做口感好? 香辣豆干有哪些简单又好吃的做法? 有哪些做香辣豆干的技巧和教程值得分享? 犯了使用假币罪怎么判刑 怎么用ppt画出重点? 三国志战略版甘宁阵容搭配 《刀剑天下》一骑当千介绍_《刀剑天下》一骑当千是什么 美眉PK校草:Who怕Whotxt全集下载 《双锋》txt全集下载 谁怕谁啊 怎么说呢 潮阳区第一中学学校校风 潮阳区第一中学学校规模 潮阳市第一中学规模 e.m.y.i.h.r.s.t.c.组成一个英语单词,是一个学科。 计算机辅助设计与制造技术目录 计算机辅助设计与制造目录 计算机辅助设计3DS MAX的应用目录
  • 焦点

最新推荐

猜你喜欢

热门推荐