套包含 1 亿以上图形(图像) 的图库建立多模态检索系统,同时支持:
以图搜图:上传图片,返回视觉最相似的图形结果。
文字搜图:输入文本描述,返回语义匹配的图形结果。
系统要求在高并发下实现秒级检索响应,特征提取与向量检索需具备水平扩展能力。诚邀一名具备大规模向量检索系统实战经验的工程师,独立或主导完成整个后端检索系统的设计、开发与调优。
点击空白处退出提示
套包含 1 亿以上图形(图像) 的图库建立多模态检索系统,同时支持:
以图搜图:上传图片,返回视觉最相似的图形结果。
文字搜图:输入文本描述,返回语义匹配的图形结果。
系统要求在高并发下实现秒级检索响应,特征提取与向量检索需具备水平扩展能力。诚邀一名具备大规模向量检索系统实战经验的工程师,独立或主导完成整个后端检索系统的设计、开发与调优。
一个完整的系统通常包含几个关键部分,它们共同保障了高并发下的快速响应和水平扩展能力:
多模态嵌入模型:比如开源的CLIP模型或云服务商提供的专有模型,是系统的“大脑”,负责理解并向量化所有输入内容。它能进行零样本学习,即无需针对特定图片集训练,就能理解各种自然语言描述。
高性能向量检索数据库:这是系统的“记忆库”和“搜索引擎”。当图片库达到上亿级别时,需要一个像Milvus、FAISS这样的专业向量数据库来存储所有向量,并实现毫秒级的相似度检索。
云端服务与检索增强生成(RAG):成熟的方案常与云服务结合,提供一键式的数据处理和索引构建能力。更重要的是,多模态RAG可以将其应用于更复杂的场景,例如一个AI助理不仅能根据你的问题找到相关的手册文字,还能把手册里的结构图、配件清单等图片作为证据一并找出,并进行分析回答
我负责整个方案的制定,POC demo 代码实现,调试及部署。
并制定scale up 升级方案的具体制定。
这个系统可以支撑1亿+图像检索,单次检索延迟

评论