1. 医疗健康行业,ai 应用
2. 解决RAG在企业中的应用
3. 解决Agent在企业中的应用
点击空白处退出提示
1. 医疗健康行业,ai 应用
2. 解决RAG在企业中的应用
3. 解决Agent在企业中的应用
基于 Agentic Fusion 已构建的 Milvus 体检健康知识库,开发 AI 执行层服务,专注增强型 RAG 检索、AIOps 智能运维、垂直领域微调与 ReAct Agent 工具集。通过 REST API 被 Agentic Fusion 的工作流节点调用,形成“基础设施 + 智能执行”的混合架构。
技术栈:
Python 3.10、LangChain、LlamaIndex、FastAPI、Milvus、LLaMA Factory、Qwen2.5-7B、RAGAS、Ollama/vLLM、Docker
核心功能:
• 增强型 RAG 检索:从 Milvus 读取体检知识库数据,实现混合检索(向量+BM25)+ RRF 融合 + BGE-Reranker 重排序 + 父子分块策略,p99 延迟
个人职责与核心贡献:
• 检索架构设计:基于 LlamaIndex 构建多级检索流水线:① 双路召回(向量 + BM25);② RRF 融合排序;③ BGE-Reranker 精排。相比单路检索,召回率提升至 82%,p99 延迟控制在 0.9s 以内。
• AIOps 模块:设计多 Agent 协同的告警聚合、日志挖掘、指标诊断与修复建议流程,显著提升运维自动化水平。
• LoRA 微调与部署:基于 LLaMA Factory 微调 Qwen2.5-7B,构建 3 万条体检健康数据,准确率提升至 88%;采用 Ollama + vLLM 双栈方案,单卡吞吐量提升 2-3 倍,支持完全离线推理。
• RAGAS 评估:搭建体检评估数据集,以忠实度、答案相关性为核心指标,优化后忠实度 92%、答案相关性 0.91,形成闭环迭代。
• ReAct Agent 实现:基于 LangChain 封装 5 个专用工具(套餐推荐、报告分析、健康建议、复查提醒、趋势分析),支持指标对比与生活方式建议生成。
• 混合架构集成:通过 FastAPI 暴露 REST API,与 Agentic Fusion 中台实现“编排与执行分离”——Java 中台负责工作流调度、模型路由、状态持久化;Python 服务专注 RAG 检索、Agent 推理、微调模型调用。
项目成果:
• 累计处理报告解读请求 5000+ 次,用户反馈良好。
• AIOps 模块使故障发现时间缩短 60%,告警准确率提升 35%。
• 通过混合架构,既保留了 Java 中台的企业级稳定性,又快速引入了 Python AI 生态的灵活性与前沿能力,为团队后续拓展更多 AI 场景提供了可复用的模式。




评论