本模型所述的任务为流感知(Streamig Perceptio)任务,该任务为视频目标检测(Video Object Detectio, VOD)任务的一个新的细分方向。如上图上半部分所示,传统的VOD采用离线的处理模式,没有考虑模型的延时,所以模型检测结果和真实环境存在由于模型延时造成的误差。而流感知任务在关注模型精度的同时,也考虑了模型的延时,如上图下半部分所示,这样得到的检测结果与真实环境更加匹配。所以说,流感知任务是一个更加贴近自动驾驶真实应用场景的任务。 DAMO-StreamNet是对流感知任务已有方法StreamYOLO和LogShortNet的改进,主要的改进点有以下几个方面: DAMO-StreamNet的整体框图如下图所示: 该模型适用于自动驾驶场景目标预测检测,,支持8类交通目标检测,具体的类别信息如下: 在ModelScope框架上,提供输入视频,即可以通过简单的Pipelie调用使用当前模型,得到视频中目标位置及类别。 安装相关的依赖库: 基础示例代码。下面的示例代码展示的是如何通过一个视频作为输入,得到图片对应的交通目标坐标信息。 Argoverse-HD 数据集是最近提出的自动驾驶数据集,该数据集与其他的自动驾驶相比,数据规模中等,复杂程度较高,是一个较有代表性的数据集。更重要的是,Argoverse-HD 是第一个提出流感知任务的数据集,并且设计了Stream AP评测标准。该标准将感知时延充分考虑,实现对模型的性能-速度的全面、有效评价。 本模型暂时不支持fietue, 具体离线训练细节如下: 模型在Argoverse-HD的验证集上客观指标如下:DAMO-StreamNet 模型介绍
任务说明
模型描述
期望模型使用方式以及适用范围
类别ID
类别名称
1
perso
2
bicycle
3
car
4
motorcycle
5
bus
6
truck
7
traffic_light
8
stop_sig
如何使用
推理代码范例
pip istall yolox==0.3.0 # or: pip istall -r requiremets.txt
# modelscope>=1.8.0 ,在1.8.0和1.8.1上测试通过
import cv2
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
from modelscope.outputs import OutputKeys
model_id = 'MorigsuLee/cv_cspet_video-object-detectio_damo-streamet'
test_video = 'https://modelscope.oss-c-beijig.aliyucs.com/test/videos/test_realtime_vod.mp4'
# 初始化实时检测pipelie
realtime_video_object_detectio = pipelie(
Tasks.video_object_detectio, model=model_id, model_revisio='v1.0.4')
# 进行实时检测
result = realtime_video_object_detectio(test_video)
if result:
bboxes_list = result[OutputKeys.BOXES]
prit(bboxes_list)
else:
raise ValueError('process error')
模型局限性以及可能的偏差
训练数据介绍
训练
输入预处理
数据评估及结果
Model
size
velocity
sAP
0.5:0.95sAP50
sAP75
weights
COCO pretraied weights
DAMO-StreamNet-S
600×960
1x
31.8
52.3
31.0
official
official
DAMO-StreamNet-M
600×960
1x
35.5
57.0
36.2
official
official
DAMO-StreamNet-L
600×960
1x
37.8
59.1
38.6
official
official
相关论文以及引用信息
@article{DAMO_StreamNet,
title={DAMO-StreamNet: Optimizig Streamig Perceptio i Autoomous Drivig},
author={Ju-Ya He, Zhi-Qi Cheg, Cheyag Li, Wagmeg Xiag, Bighui Che, Bi Luo, Yifeg Geg, Xuasog Xie},
joural={IJCAI},
year={2023}
}
点击空白处退出提示
评论