企业多套业务系统分散,人工巡检、故障排查效率低,日志数据体量庞大难以人工分析。为实现运维工作智能化升级,搭建智能运维监控平台。面向企业IT运维、系统保障场景,依托Java后端结合大模型能力,解决故障定位慢、告警冗余、运维成本高的痛点,实现全自动化监控与智能诊断。
点击空白处退出提示
企业多套业务系统分散,人工巡检、故障排查效率低,日志数据体量庞大难以人工分析。为实现运维工作智能化升级,搭建智能运维监控平台。面向企业IT运维、系统保障场景,依托Java后端结合大模型能力,解决故障定位慢、告警冗余、运维成本高的痛点,实现全自动化监控与智能诊断。
系统分为集群监控、日志采集、AI智能诊断、告警推送、权限管理、报表统计六大模块。支持全服务器、服务接口状态实时监控;自动采集汇总全量运行日志;接入大模型完成日志语义分析、故障根因定位、异常风险预判。支持多渠道告警通知,可自定义告警规则。内置数据报表功能,自动生成运维分析报告,同时提供账号、角色、接口权限管控,满足团队分级使用需求。
负责后端服务开发、日志对接接口、大模型调用模块及核心业务迭代。技术栈:Java、Spring Boot、Spring Cloud、MyBatis、Redis、MySQL、消息队列。采用微服务架构。亮点:深度集成大模型实现日志智能解析与故障自动溯源,大幅缩短排障时长。难点:海量日志高并发写入、大模型接口调用超时、分析准确率波动,通过异步队列、接口熔断、精细化提示词优化,保障系统高可用与分析效果。



评论