解决 Jenkins 构建失败后人工查看日志耗时长、定位责任人繁琐且复杂的问题。
面向企业 CI/CD 运维场景,通过 AI Agent 实现报错自动分析与根因定位,提升故障响应效率。
点击空白处退出提示
解决 Jenkins 构建失败后人工查看日志耗时长、定位责任人繁琐且复杂的问题。
面向企业 CI/CD 运维场景,通过 AI Agent 实现报错自动分析与根因定位,提升故障响应效率。
核心功能模块:
AI 智能诊断模块:集成大模型接口,能够自动接收 Jenkins 构建失败后的报错日志,通过 Agent Workflow 分析日志堆栈,定位问题代码提交(Gerrit Commit),并给出修复建议或责任人。
Oncall 自动化机器人(飞书):基于飞书服务台开发交互机器人。用户Jenkins job 链接即可触发诊断,Agent 自动拉取日志、分析错误类型(如编译错误、单元测试失败、Git 拉取异常),并回复解决方案。
自助运维交互模块:基于 Flask + Redis 实现。用户可在飞书通过指令(如 /create_branch、/automerge)触发后端逻辑,利用 Webhook 实现代码仓库的自动创建、分支管理和自助合入。也提供web页面对话功能
前端配置与展示界面:使用 React 构建简单的前端管理界面,用于查看历史诊断记录、Agent 对话日志以及知识库命中率统计。
全流程架构设计与开发:独立负责整个 Agent 的后端逻辑开发,包括模型链接、数据库设计以及 Tool 工具包的编写。
核心诊断逻辑实现:编写 Python 脚本解析 Jenkins 返回的原始大日志,并将其初步分块得到小日志后喂给 Agent,同时封装了 Gerrit API 工具,使 Agent 具备“读取报错 -> 查询代码变更 -> 定位责任人”的推理能力。
飞书机器人集成:使用 Flask 框架编写飞书服务台的消息路由接口,利用 Redis 处理并发请求与用户会话缓存,实现了卡片式交互和异步任务处理。





评论