本项目针对视频目标识别任务中检测目标跳变,截断目标难以检测等问题,采用一种依赖于 时间信息的后处理来使目标检测结果更加连贯和稳定,提升目标检测效果
在 detr 类目标检测方法中,query vector 作用类似传统目标检测中的 anchor,区别的点在 于它可以通过梯度优化;而在视频目标检测问题,尤其是自动驾驶领域,相邻帧的 bbox 位 置变化并不明显,可以提供一定的辅助信息,因此可以采用前帧图片得到一个蕴含 bbox 信
息的 vector,在下一帧识别时可以作为网络的 query vector
点击空白处退出提示
评论