描述:面向知识密集型行业,对于这类资料的管理往往总是力不从心。处理 200+ 小时音频及大量 PDF。
点击空白处退出提示
描述:面向知识密集型行业,对于这类资料的管理往往总是力不从心。处理 200+ 小时音频及大量 PDF。
实现 VAD 切割、说话人分离、视觉特征提取,构建文本‑音频‑视觉三路混合索引。微调 BERT 意图分类(4 分类 F1=0.92),LLM 策略路由(直接检索 / HyDE / 子查询拆解)。融合 BM25 + 语义向量 + Cross‑Encoder 精排,并构建 Neo4j 认知图谱。
· 成果:检索 Top5 准确率从 78% 提升至 91%,季度知识回顾 15 分钟自动生成,持续使用 6 个月。



评论