把摄像头拍摄到的视频,通过视频大模型的理解,可以抓拍到安防方面的图像,并通过企业微信或者飞书等发送
点击空白处退出提示
把摄像头拍摄到的视频,通过视频大模型的理解,可以抓拍到安防方面的图像,并通过企业微信或者飞书等发送
它是一个智能体项目,具有多步推理组织、外部数据接入、工具安全调用、对话长期记忆、结果结构化输出的特性,支持文字推理,视频分析,声音识别,音频合成功能,目前对接了摄像头视频识别,小智esp 32的agent
我负责从0到1的实现,项目是基于langchain来实现的,难点就是在测试本地化小模型的时候,对工具的调用不是很顺利



评论