AI Agent / 多智能体系统
你做的蚁群多Agent协同(Scout→Worker→Synthesizer→QC)正是当前AI Agent的核心架构模式
企业需求:AI客服、AI运营助手、AI代码助手、AI数据分析 — 都需要多Agent协作
点击空白处退出提示
AI Agent / 多智能体系统
你做的蚁群多Agent协同(Scout→Worker→Synthesizer→QC)正是当前AI Agent的核心架构模式
企业需求:AI客服、AI运营助手、AI代码助手、AI数据分析 — 都需要多Agent协作
一、智能对话系统
多模型自动路由:根据用户意图自动选择最合适的后端(对话/搜索/代码/蚁群系统)
上下文记忆:对话历史自动持久化,支持多轮连续对话
分层记忆管理:短期会话缓存 + SQLite持久化 + 向量语义检索三层架构
记忆活跃度排序:基于访问频率和时间衰减的智能排序,自动清理过期记忆
二、蚁群多Agent协同系统
复杂任务自动分解为子步骤,由多Agent协作完成:
Scout(侦察蚁):分析任务意图,提取搜索关键词,规划执行路径
Worker(工蚁):执行具体操作(网络搜索、文件读取、代码生成)
Synthesizer(汇总蚁):整合多个Worker结果,格式化输出最终报告
QC(质控):自动质量检查,不满意时触发修正回路
经验回写:任务完成后Agent经验三路沉淀(知识树/源池/信息素)
三、双模LLM调度引擎
本地Ollama:qwen2.5:7b本地运行,免费、隐私、离线可用
云端DeepSeek:API接入,GPT-4级质量
智能切换:检测API Key自动选主模型,有Key用云端,无Key用本地
双向降级容灾:主模型故障时自动降级到备用模型,确保服务不中断
VRAM显存优化:6GB显卡下通过num_ctx动态调控稳定运行7B模型
四、鲁棒网络搜索链路
四级降级搜索,确保任何环境都能获取信息:
fetch:标准Node.js HTTP请求(5秒超时)
curl.exe:Windows系统工具,走系统网络栈
DuckDuckGo:HTML版搜索引擎备选
Edge无头浏览器:真实浏览器渲染,100%绕过反爬虫
五、智能意图路由
关键词+语义双通道识别:精准理解用户想做什么
文件路径预检:检测到文件路径自动路由到文件分析流程
复杂任务分流:预测/分析类任务自动进入蚁群系统
多意图冲突解决:当多个意图同时匹配时按优先级选择最优路由
六、Windows工具调用
1.项目全程独立开发
2.技术架构总览
层级 技术
前端UI React 18 + Vite + TailwindCSS + PWA
桌面壳层 Tauri(Rust + Web混合)
后端服务 Node.js + Express + TypeScript
数据库 SQLite(FTS5全文索引 + BM25排序)
向量检索 ChromaDB
AI引擎 Ollama本地 + DeepSeek云端
通信 REST API + WebSocket实时推送
部署 Docker支持,一键构建
3.亮点
1. 蚁群多Agent协同调度(核心亮点)
技术本质:分布式任务编排引擎
任务自动分解为子步骤,按互补性配对Agent(不是随机分配)
链式执行:Scout侦察 → Worker执行 → Synthesizer汇总 → QC质控
经验三路回写:任务结束后Agent经验分别沉淀到知识树、源池、信息素系统
类似蠕虫串联合体的链式协调机制
2. 双模LLM智能调度与双向降级
技术本质:高可用模型服务架构
检测API Key状态 → 自动选主模型(有Key云端优先,无Key本地优先)
任一模型故障 → 毫秒级自动降级到备用模型
7处LLM调用统一封装为callSmartLLM(),业务层无感知
VRAM精细调控:num_ctx动态限制上下文窗口,6GB显存跑7B模型




评论