刘志远
16小时前在线
全职 · 500/日  ·  10875/月
工作时间: 工作日20:00-00:00、周末10:00-19:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

1、9年运维经验,擅长从架构优化、CI/CD、监控告警、容量规划等多维度提升系统SLA,事故MTTR缩短至15分钟内,核心系统SLA达99%以上。近期深耕 AIOps,探索 AI 在故障自愈、根因分析等场景的应用。

2、云原生与混合云实战:具备从0到1构建K8s集群及混合云架构经验,精通阿里云、腾讯云、华为云等公有云,通过资源治理与弹性策略实现云成本降低25%-30%。

3、自动化运维与开发能力:从 0 到 1主导DevOps全流程建设,熟练使用Python/Shell开发自动化运维系统(如录制系统、发布 系统),通过代码解决线上问题,提升运维效率。

4、故障解决与应急响应:建立全链路监控与告警体系(Prometheus+ELK+SkyWalking),紧急性告警有效率99%,能快速定位并解决线上故障。

工作经历

  • 2024-03-13 -2026-01-29深圳市旦米科技有限公司高级运维工程师

    1、管理公司所有的公有云平台,包括阿里云、腾讯云、华为云、移动云等,负责资源规划、采购、续费等。 2、负责公司线上业务的日常运维、网络安全、备份更新、系统和平台监控预警,确保线上系统的稳定性; 3、负责公司混合云运维架构从0到1的建设。通过RoterOS打通本地机房、托管机房、阿里云网络,实现生产业务的多地负载与本地灾备,保障业务的稳定性; 4、负责公司DevOps流程从0到1的建设。通过GitLab、Jenkins、PipeLine、SonarQube、Fortify、K8S、Prometheus、AlterManager***等工具实现编码 → 构建 → 测试 → 发布 → 部署 → 运维 → 监控 → 反馈 → 再编码的完整过程; 5、负责公司监控系统基础建设和优化。本地环境(开发、测试)通过zabbix监控本地机房、服务器硬件,通过prometheus监控K8S集群,通过ELK实时采集和分析系统与应用的日志,通过Skywalking监控微服务集群、采集jvm实时数据、实时追踪链路等;生产环境(预发布、线上)通过云监控来监控服务器硬件、容器集群,通过SLS实时采集和分析

  • 2022-08-15 -2024-01-31中资国恒科技有限公司高级运维工程师

    1、负责公司线上业务(大宗一站通、SCM系统、WMS平台)的日常运维、网络安全、备份更新、系统和平台监控预警,确保线上系统sla指标; 2、负责公司混合云运维架构的基础建设。本地机房分为开发环境、测试环境、质量验收环境、生产灾备环境四个环境,各环境网段隔离,华为云生产环境,vpc和安全组策略保障网络安全,打通本地机房与华为云网络; 3、负责公司devops基础建设和优化,gitlab、jenkins、pipline、sonarqube、ansible-playbook、k8s、企微通知; 4、负责公司监控系统基础建设和优化,机房、服务器硬件由zabbix平台监控,后端应用由pinpoint系统监控,系统及应用日志由elk日志分析平台监控,k8s平台由prometheus系统监控、自定义扩缩容,通过webhook和python脚本实***警,及时处理系统或业务相关问题,尽量使用户无感知; 5、负责公司业务安全,服务器由vpc、安全组、iptables保障网络安全,k8s平台通过rabc、命名空间网络隔离、准入控制器保障网络安全,docker镜像通过定期漏洞扫描、更新软件版本保障

  • 2017-11-27 -2022-07-15深圳市兴隆文化科技有限公司运维工程师

    主要负责公司业务和流媒体的运维及运维开发工作。 1、业务方面,由于公司业务的飞速扩张,为了更好地维护线上系统,保障系统的高可用性,引进并实施一些相应的运维框架,如lvs+nginx、k8s+docker容器化、ansible/saltstack、jumpserver、kvm等,提高服务质量,减少运维资源成本;为了节省运维发布人力成本,制定相关规则完成项目的自动化部署,发布过程包括编译、发布、自动化测试、日志采集、监控告警、生产上线,工具及平台:gitlab、SonarQube、jenkins、pipline/ansible-playbook、elk、zabbix、altermanage,构建devops平台完成自动化部署方案; 2、流媒体方面,根据业务发展需求采集、迁移、发布媒资,引入第三方cdn、p2p技术支撑,大流量机器选型、迭代与采购等,保障流媒体系统稳定的同时,边缘化冷数据,提高服务器资源可用性,降低每月服务器成本; 3、监控方面,构建全链路的监控体系,使用elk、zabbix、prometheus、pinpoint、python脚本监控服务器系统服务、业务接口和数据层、流媒体

教育经历

  • 2014-09-13 - 2018-06-20湖南科技学院电子科学与技术本科

语言

中文母语水平
0
1
2
3
4
5

技能

Linux熟练
K8S熟练
Zabbix熟练
HaProxy熟练
Jenkins熟练
0
1
2
3
4
5
0
1
2
3
4
5
作品
K8S高可用集群从0到1搭建

1、APIServer多副本+lb2、etcd集群,存储集群状态,多数节点正常即可读写3、ControllerManager多副本选主,仅leader执行控制循环,备机热备4、Scheduler多副本选主,仅leader执行Pod调度,备机待命5、CoreDNS/CNI多副本+反亲和性,实现服务发现

0
2026-06-11 10:42
DevOps全流程从0到1构建

1、账户最小权限控制,前后端工程师只专注于开发中的项目2、定义联调、测试、预发布、生产等环境分支,通过merge触发钩子自动发布,也可以基于用户点击构建部署(谁构建,谁运行)3、24小时不间断发布4、代码质量检测、安全检测基线,可自定义5、K8S下线钩子配合注册中心实现应用优雅上下线6、监控发布过程

0
2026-06-11 10:24
更新于: 1天前 浏览: 5