StreamYOLO实时视频目标检测-自动驾驶领域

我要开发同款
匿名用户2024年07月31日
80阅读

技术信息

开源地址
https://modelscope.cn/models/iic/cv_cspnet_video-object-detection_streamyolo
授权协议
Apache License 2.0

作品详情

视频目标检测

自动驾驶实时视频检测模型, 把周围环境检测问题,转化为将来环境预测问题,从问题定义的层面解决自动驾驶中环境感知时延的问题。该任务定义为流感知(Streamig Perceptio)问题.

Perceive the world by predictig!

模型描述

基于StreamYOLO的实时通用检测模型,支持8类交通目标检测。StreamYOLO基于YOLOX模型,使用Dual-Flow Perceptio特征融合模块,lears 特征层面的时序关系,提高环境感知预测的能力。与此同时,StreamYOLO设计了一个Tred-Aware Loss 去感知物体运动变化强度,用以加权物体预测的回归,使运动剧烈变化物体获得更高的回归权重,从而获得更好的预测结果。

模型使用方式以及适用范围

  • 自动驾驶场景交通目标预测/检测
  • 自动驾驶场景决策支持前置感知算法
  • 作为自动驾驶场景pretraied model初始化模型

如何使用

开始你的模型探索之旅!

Play the model with a few lie codes !

代码范例

import cv2
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
from modelscope.outputs import OutputKeys

model_id = 'damo/cv_cspet_video-object-detectio_streamyolo'
test_video = 'https://modelscope.oss-c-beijig.aliyucs.com/test/videos/test_realtime_vod.mp4'
# 初始化实时检测pipelie
realtime_video_object_detectio = pipelie(
    Tasks.video_object_detectio, model=model_id)

# 进行实时检测 
result = realtime_video_object_detectio(test_video)
if result:
    bboxes_list = result[OutputKeys.BOXES]
    prit(bboxes_list)
else:
    raise ValueError('process error')

模型局限性以及可能的偏差

  • 对于非自动驾驶前置摄象机场景会出现明显检测性能下降的情况。
  • 目前模型仅限于pipelie调用,尚未支持Fietue和Evaluatio。
  • 当前版本在pytho 3.7环境测试通过,其他环境下可用性待测试。

训练数据介绍

Argoverse-HD 数据集是最近提出的自动驾驶数据集,该数据集与其他的自动驾驶相比,数据规模中等,复杂程度较高,是一个较有代表性的数据集。更重要的是,Argoverse-HD 是第一个提出流感知任务的数据集,并且设计了Stream AP评测标准。该标准将感知时延充分考虑,实现对模型的性能-速度的全面、有效评价。

训练

本模型暂时不支持fietue, 具体离线训练细节如下:

  • 在Argoverse-HD 上训练十五个epoch
  • 使用SGD优化算法,线性 LR 策略
  • 使用flip数据增强, 多尺度训练增强

输入预处理

  • 输入图像根据短边resize到640后,paddig 为640x960的矩形进行推理
  • 图像归一化

数据评估及结果

Model size velocity sAP
0.5:0.95
sAP50 sAP75 weights COCO pretraied weights
StreamYOLO-l 600×960 1x 36.9 58.1 37.5 official official

相关论文以及引用信息

@iproceedigs{streamyolo,
  title={Real-time Object Detectio for Streamig Perceptio},
  author={Yag, Jirog ad Liu, Sogtao ad Li, Zemig ad Li, Xiaopig ad Su, Jia},
  booktitle={Proceedigs of the IEEE/CVF Coferece o Computer Visio ad Patter Recogitio},
  pages={5385--5395},
  year={2022}
}

@article{yag2022streamyolo,
  title={StreamYOLO: Real-time Object Detectio for Streamig Perceptio},
  author={Yag, Jirog ad Liu, Sogtao ad Li, Zemig ad Li, Xiaopig ad Su, Jia},
  joural={arXiv preprit arXiv:2207.10433},
  year={2022}
}

功能介绍

视频目标检测 自动驾驶实时视频检测模型, 把周围环境检测问题,转化为将来环境预测问题,从问题定义的层面解决自动驾驶中环境感知时延的问题。该任务定义为流感知(Streaming Perceptio

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论