alex
1小时前在线
全职 · 700/日  ·  15225/月
工作时间: 工作日09:00-23:00、周末9:00-23:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

1.精通Linux系统管理与优化,熟练掌握CentOS、Ubuntu等主流发行版,擅长通过Shell/Python脚本实现自动化运维与批量部署

2.拥有丰富的监控与告警体系建设经验,能灵活使用Zabbix、Prometheus、Grafana、ELK 等工具,实现上千节点的统一监控与日志分析,制定关键指标与告警策略,大幅缩短平均故障定位时间(MTTR)

3.精通DevOps流程建设,主导设计并实施基于Jenkins、GitLab CI与Ansible的CI/CD流水线,实现从代码提交到上线全流程自动化,版本交付效率提升70%,并有效避免人为操作风险。

4.在云平台架构方面具备多年实战经验,熟悉AWS、阿里云、腾讯云的混合云与多云方案

5.擅长技术栈:Linux、Nginx、MySQL、Redis、Zabbix/Prometheus、Jenkins、Docker、Ansible、Shell/Python

工作经历

  • 2015-04-01 -至今游戏公司高级运维

    1.负责网络游戏业务的部署、新版本的发布、服务端的变更; 2.负责与游戏运营的日常沟通交流,接收并处理项目组提出的运维需求; 3.负责项目组相关运营支撑工具的开发; 4.负责日常运维工作的自动化、工具化建设; 5.负责新游戏的接入、架构评估、痛点挖掘优化; 6.负责监控网络游戏业务的运行状况,及时处理游戏运行中出现的故障,保障网络游戏服务的正常提供; 7.各类安全事件的及时跟进,包括Web漏洞处理、DDOS防御,及其他安全加固措施实施; 8.运维部署、安全规范的制定及推动执行。

教育经历

  • 2006-09-01 - 2009-07-01南京大学计算机信息管理专科

语言

中文母语水平
0
1
2
3
4
5

技能

Python精通
Shell精通
0
1
2
3
4
5
0
1
2
3
4
5
作品
企业级监控与报警体系建设|自动化运维与持续集成|数据库高可用与备份容灾

1.企业级监控与报警体系建设部署并维护Zabbix/Prometheus监控平台,监控服务器、数据库、中间件运行状态;编写自定义脚本监控业务指标,接入钉钉/企业*,实现秒级报警;建立日志采集与可视化分析(ELK/Grafana)。成果:平均故障发现时间缩短60%,业务可用性提升到99.9%。2.自

0
2025-09-13 16:04
更新于: 3小时前 浏览: 15