基于情报信息分析的需求,需要对几十路视频进行视频画面分析,将画面内容进行分类及目标检测识别,并基于此构建检索系统。
基于不断增长的视频,构建十亿级别特征向量系统,实现全量特征检索系统,实现根据任何图片素材,进行相似匹配,查找定位到特定视频画面。
点击空白处退出提示
基于情报信息分析的需求,需要对几十路视频进行视频画面分析,将画面内容进行分类及目标检测识别,并基于此构建检索系统。
基于不断增长的视频,构建十亿级别特征向量系统,实现全量特征检索系统,实现根据任何图片素材,进行相似匹配,查找定位到特定视频画面。
主要模块:画面分类模型接口、画面目标检测模型接口、全量视频特征构建与查询系统
功能描述:根据需求,训练了画面分类模型、目标检测模型,并进行优化后,部署到内网系统,通过接口api,提供实时画面的分析、筛选。
构筑集群系统,对完整视频进行加速特征抽取,构建优化索引系统,实现十亿级别特征检索。实现根据任何图片素材,根据各种接口类型需求,进行匹配,查找定位到特定视频画面或画面的具体位置。
c、具体职责
根据客户需求,确定技术方案,完成编码、测试、部署、优化等技术环节。
d、技术栈
主要使用Python、Pytorch、Milvus、redis、mysql、docker。
对模型,进行了底层优化,模型推理时间稳定在几十毫秒。
基于大量的并发模型推理需求,构建了负载均衡推理系统。
基于大量高负载的视频处理及特征抽取需求,设计基于内存的运行机制,并且在底层视频解码进行了针对硬件的加速处理。



评论