一个基于FAISS和sentence-transformers的高性能文献检索系统,支持多索引架构、混合检索、重排序和LLM问答。
✅ 多索引架构:将大规模文档分割成多个小索引,避免内存溢出
✅ 完整内容索引:基于MinerU的full.md,保留文档完整信息
✅ 混合检索:向量检索(语义) + BM25(关键词)
✅ 智能重排序:Cross-Encoder精准排序
✅ LLM集成:DeepSeek智能问答
✅ 低内存友好:12G内存即可运行
✅ 断点续传:支持中断后继续构建
✅ Google Drive集成:自动保存到云端,永不丢失
点击空白处退出提示












评论