5年AI工程化落地经验,曾主导农业银行总行Multi-Agent智能服务平台研发(Agent准确率94%,Token成本降低77%)。具备农行/交行/招行三大行金融级系统实战经验:交行2000 TPS资产交易系统(0错账)、招行15000 QPS微服务重构(可用性99.99%)。独立完成约8000行核心代码(Multi-Agent引擎/中间件编排/记忆系统/权限控制)。当前基于RAGFlow搭建企业级知识库&RAG智能问答系统,掌握完整RAG Pipeline(向量检索/混合检索/RAGAS质量评估)及生产级部署能力。
【核心功能】
1. 文档知识库管理:支持文档分类、富文本编辑、标签体系、版本管理、发布状态控制(草稿/已发布/已归档)
2. RAG智能问答:基于RAGFlow构建检索增强生成系统,用户提问自动从知识库中检索相关文档片段,结合LLM生成准确回答
3. 问答社区:支持用户发起提问、专家回答、问题解决闭环(待回答→已回答→已解决),含投票和标签分类
4. 用户权限体系:三级角色(管理员/编辑/访客),细粒度权限控制
5. 分类与检索:多级目录分类 + 关键词全文搜索
【技术架构】
- 后端:FastAPI + SQLAlchemy + SQLite(可切换MySQL/PostgreSQL)
- 前端:React + TypeScript + Material-UI(MUI)
- AI层:RAGFlow + 向量数据库 + LLM(支持私有化部署)
- 认证:JWT Token + RBAC权限模型
【亮点1 - 生产级RAG工程化】
不是Demo级别原型,而是具备金融级可靠性的生产系统。参考农行项目经验,内置RAGAS双层质量门控(Context Precision/Recall + Faithfulness/Relevancy),确保检索和生成的准确性可控。
【亮点2 - Multi-Agent扩展能力】
架构预留了Multi-Agent协作接口,可从单一问答升级为多智能体工作流(如:检索Agent → 分析Agent → 报告生成Agent),复用在农行验证过的DeepAgent主从式框架设计。
【亮点3 - Token成本优化】
集成Context Budget Controller动态Token分配策略(P1用户输入 > P2检索结果 > P3历史记忆),配合对话摘要压缩(压缩率80%),可将LLM调用成本降低50%-77%(已在农行项目验证)。
【亮点4 - 可观测性内置】
结构化日志(JSON/TraceID) + API性能监控(P50/P95/P99),故障定位时间
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论