个人介绍
1、本人一直在做系统运维方面的工作,最Linux、K8s、CICD、prometheus方面都有较深的工作经验,能快速处理常见的故障,分析系统瓶颈,优化系统;能进行云资源成本管控和优化。
2、编写脚本处理重复的任务,如备份、日常巡检等
3、利用AI Agent 进行日常告警的根因分析及快速处理
工作经历
2023-07-01 -2025-02-01上海科之锐人才咨询有限公司运维工程师已认证
1. 负责自建K8S日常维护、性能优化、问题排查处理,保证项目流程及时交付 2. 负责阿里云和华为云K8S集群部署、配置以及RDS、Redis、OSS、SLS等云产品配置和维护 3. 快速响应线上K8S集群和应用告警,对故障进行排查处理并输出文档记录 4. 编写dockerfile和helm,使用Jenkins+Gitlab进行应用系统自动化部署 5. 与团队合作,将阿里云k8s集群迁移至AWS EKS 6. 编写Shell脚本和Ansible进行自动化任务处理 7. 负责公司产品私有化部署和故障处理
2022-07-01 -2023-06-30浩鲸云计算科技股份有限公司云计算运维工程师已认证
1. 负责云平台产品日常巡检、告警排查处理,保障平台稳定运行 2. 负责客户使用云产品(ECS、RDS、OSS、SLS等)技术答疑和日常问题排查处理 3. 进行防火墙策略和规则配置;进行安骑士和waf等安全产品配置和管理 4. 对IAAS设施损坏硬件进行更换,如:硬盘、cpu、网卡等 5. 对专有云平台进行版本升级和验证
2019-06-01 -2022-06-30深圳市伍壹物联科技有限公司运维工程师已认证
1. 使用Gitlab 和Jenkins 实现代码自动部署 2. 使用Nginx和Keepalive部署高可用系统 3. 配合开发搭建测试平台,协助开发持续进行项目改进和服务器优化调整 4. 负责项目有关技术文档的编写和提交,相关故障、疑难问题排查处理并汇总提交 5. 编写Shell 脚本进行自动化任务处理 6. 使用Docker 制作镜像快速部署应用 7. 使用Promethues、Grafana进行服务器和业务监控告警 8. 使用Elk进行日志收集分析
教育经历
2022-03-01 - 2024-07-01湖北师范大学计算机科学与技术本科已认证





