公司业务高度依赖会员系统、销售系统、供应链系统等核心软件,此前服务器频繁出现蓝屏宕机、假死、宕机后无法自动重启等故障,导致服务中断,严重影响业务正常开展。为解决这一痛点,提升系统稳定性、保障业务连续性,我主导立项并推进高可用集群架构搭建项目,从零构建适配公司业务的高可用基础服务体系。
点击空白处退出提示
公司业务高度依赖会员系统、销售系统、供应链系统等核心软件,此前服务器频繁出现蓝屏宕机、假死、宕机后无法自动重启等故障,导致服务中断,严重影响业务正常开展。为解决这一痛点,提升系统稳定性、保障业务连续性,我主导立项并推进高可用集群架构搭建项目,从零构建适配公司业务的高可用基础服务体系。
1. 搭建高可用集群:完成生产、测试环境基础服务架构搭建,共搭建3个集群,其中2个为1个master+1个node的小集群,1个为3个master+10个node的大集群;通过节点冗余、故障自动切换,规避单点故障,为核心系统提供可靠底层支撑,优化CI/CD流程实现部署自动化。
2. 构建全维度监控:为所有系统、应用服务、中间件及数据库添加监控,实现心跳检测、异常数据报警,实时掌握系统健康状态,提前预警、快速处理故障,提升系统稳定性。
全程主导项目从零落地,负责整体CI/CD流程设计、集群各节点结构规划,筛选适配工具并完成搭建与环境配置;明确功能范围,调试各模块正常运行、解决各类技术难题;制定运维规章制度,编写操作手册,保障项目长期稳定运转。




评论