个人介绍
工作经历
2023-06-07 -2026-04-27软通动力运维开发已认证
开发环境:LangChain、LangGraph、Celery、Redis 项目描述:该项目旨在构建一个智能化的运维助手,通过AI技术实现运维任务的自动化与智能化决策,从而显著提升运维效率和系统稳定性。 核心技术实现 AI Agent核心引擎:基于LangChain和LangGraph框架,设计并实现了具备状态记忆和决策规划能力的智能运维Agent,通过图结构编排复杂的运维逻辑,使其能够理解上下文并执行多步骤任务。 智能任务调度与缓存:集成Celery分布式任务队列和Redis内存数据库,实现智能体任务的异步调度、结果缓存和状态持久化,保障高并发场景下的系统响应速度和可靠性。 RAG增强型问答与路由:采用RAG技术构建运维知识库,Agent能够从海量运维文档、手册和历史案例中检索相关信息,结合大语言模型生成准确的分析结果,同时根据问题类型自动分派给不同的处理节点。 核心功能模块:离线健康巡检、网元变更影响评估、智能文档检索 项目成果:该智能运维Agent成功将常规巡检、简单故障诊断等任务自动化,处理效率提升90%,将运维人员从重复性工作中解放出来,专注于更复
2021-06-11 -2023-06-30外企德科运维开发工程师已认证
职责概述:担任华为FusionSphere电信云平台专属维护工程师,负责平台的日常运维、现网故障闭环、风险管控及自动化运维工具开发,保障电信云核心业务的高可用与连续性。 核心平台运维:负责FusionSphere虚拟化平台、eSight网管系统及配套硬件设备的日常维护、性能监控、告警管理与深度故障诊断,7*24小时响应现网突发问题,保障业务稳定运行。 变更与风险管控:严格遵循电信级运维规范,全程参与现网变更的方案制定、风险评估、评审落地与回滚保障,实现所有重大操作零失误、零事故。 自动化工具开发:针对批量配置修改、全量日志分析、常态化系统巡检等高频重复场景,使用Python开发多套自动化脚本,替代人工操作,降低人为失误风险。 工作成果:任职期间全程保障所辖电信云平台稳定运行,通过自动化工具落地,将常规巡检任务的执行效率提升50%,实现现网保障零事故、零投诉,获得客户与项目组的高度认可。
2018-09-27 -2021-11-01中软国际运维开发已认证
核心系统运维:负责网元管理系统的日常运维保障,涵盖数据备份与容灾、系统配置修改、安装部署、版本升级、现网问题闭环等全流程工作,确保系统稳定可用。 - 自动化部署工具开发:基于Python+Selenium自研端到端自动化部署工具,整合Web界面交互、远程服务器管控、软件包自动分发、环境配置等全流程,替代原有的多节点人工手动操作。 标准化运维体系建设:梳理标准化运维操作流程,基于Linux与Python开发配套管理脚本,实现系统管理、日常巡检的标准化、自动化,提升运维效率与规范性。
教育经历
2012-09-01 - 2015-06-01宁夏职业技术电气自动化专科



