个人介绍
1.熟悉主流Linux操作系统以及云原生组件的运维工作。
2.熟练使用Ansible等自动化运维工具。
3.熟悉主流数据库如Mysql的操作以及常见问题排查。
4.熟练Prometheus监控系统以及ELK日志系统的使用。
5.熟练掌握基于Vue.js的前端开发以及基于Python的后端开发。
6.熟悉公有云、私有云等大规模集群中的计算以及存储相关的运维工作。
工作经历
2022-06-09 -2024-06-07天翼云科技有限公司IT技术支持工程师
主要工作内容: 1.负责天翼云云电脑产品的公有云、私有云各个集群的日常巡检、告警处理、版本升级等; 2.参与7X24小时值班,及时响应线上生产环境的问题,确保系统的可用性; 3.优化完善部署脚本的编写,提升新集群部署的成功率以及效率。 主要业绩: 1.配合研发人员完成了从传统部署模式到k8s容器化部署模式的平滑迁移。通过定制化镜像、编写编排脚本与优化部署流程,实现了一键部署与快速回滚能力。 2.针对日常巡检、版本升级等重复性任务,使用Python/Shell/Ansible, 设计并开发了自动化运维脚本集,实现了系统健康状态的自动检查、日志自动收集分析与批量操作。 3.通过主动巡检与监控,提前发现并规避了数十次潜在故障;对于突发线上问题,凭借丰富的排查经验与工具脚本,快速定位问题并修复,确保系统的SLA达到所承诺的99.99%。
2017-07-10 -2022-06-07顺丰科技有限公司运维开发工程师
工作描述:主要工作内容: 1.参与项目需求分析,负责项目进度、任务的划分。 2.负责应用框架和网络框架的搭建、优化,项目主要业务逻辑的实现以及bug的解决。 3.参与项目的上线和后期的维护,协同处理项目中遇见的bug难题。 .项目的需求文档,接口文档书的撰写。 主要业绩: 作为项目核心开发成员,承担了部门对象存储集群管理系统从架构设计到部署运维的全栈工作,协助完成部门内其他系统如备份系统的迭代优化工 作: 1.自研集群监控管理系统,实现了错误实时告警与链路追踪,将线上问题定位平均时间从3小时缩短至15分钟。 2.前端开发:采用Vue框架开发高性能前端应用,通过组件化、懒加载与Webpack优化,极大改善了用户体验。 3.引入容器技术,构建CI/CD自动化流程,将部署效率提升70%,实现快速迭代。
教育经历
2013-09-01 - 2017-06-30广东外语外贸大学软件工程本科已认证






