# 主要面向B端客户,解决企业大量知识文档的检索需求。
# 架构设计,架构设计:采用docling对原始PDF文档的解析(文本、表格、图片),识别抽取为结构化数据,然后Embedding到向量库,文本和元数据存储到ES,使用Fusion进行bm25关键词检索和相似度向量检索进行融合求和,最后使用Reranker进行重排序,生成上下文context,由LLM整理后回复客户
# 技术栈:RAG+Embedding+Reranker+LLM+Flask+VUE
点击空白处退出提示
# 主要面向B端客户,解决企业大量知识文档的检索需求。
# 架构设计,架构设计:采用docling对原始PDF文档的解析(文本、表格、图片),识别抽取为结构化数据,然后Embedding到向量库,文本和元数据存储到ES,使用Fusion进行bm25关键词检索和相似度向量检索进行融合求和,最后使用Reranker进行重排序,生成上下文context,由LLM整理后回复客户
# 技术栈:RAG+Embedding+Reranker+LLM+Flask+VUE
评论