JasperV777
1月前来过
全职 · 600/日  ·  13050/月
工作时间: 工作日08:00-22:00、周末08:00-22:00工作地点: 北京远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

01. 互联网公司运维经验丰富,主应用运维、大数据运维方向。

02. 熟悉 Linux等操作系统,熟练使用Shell/Python/Ansible脚本编写,实现运维自动化。

03. 对Docker,Kubernetes等容器技术有深入理解和实践经验。

04. 熟悉 CI/CD 、熟练使用常用DevOps工具,如Jenkins,Sonarqube,GitLab

05. 对网络安全有一定了解,了解常见的网络安全问题及解决方案。

06. 热爱技术喜欢分享,承压能力强,有良好的团队协调组织能力。

工作经历

  • 2021-10-01 -2023-08-31贝天姆科技(北京)有限公司SRE

    1.架构选型:主导推动AWS 海外数千台云服务器 x86架构向 arm cpu架构 转型,并重新调整基础架构,最终完成度达 90%。 2.稳 定 性:跟进稳定性成熟度标准实施,分阶段从监控、故障处理、故障后分析、测试、变更管理、容量规划、开发、产品方向成功构建出稳定性体系,最终确保钱包支付业务 SLA 实现 99.99%。 3.成本管理:推动AWS 成本优化方案落地,结合 8 个业务线使用场景实施降本的同时保障服务的稳定,最终云平台成本缩减 45%,每月节省 $120,000。 4.效能管理:依据标准化架构方案,从网络划分、标签管理、实例选型、EKS 容器集群整合、名称管理、资源共享等方面解决历史遗留问题,实现千台服务器自动检查标签状态、自动初始化、自动扩缩容等功能,确保精准高效管理。 5.质量控制:主导 CICD 流程集成安全控件,并协调 10 余个业务部门参与,利用代码扫描 Sonarqube 、主机漏洞扫描 Qualys 、安全报告展示 Grafana 等工具完成安全加固。

  • 2020-05-01 -2021-09-01托普朗宁(北京)教育科技有限公司SRE

    1.架构设计:推动阿里云、亚马逊云平台 kubernetes 容器化落地,成功实现千台服务器新业务使用容器化管理,并提高了业务的灵活性伸缩能力和研发产生效率。 2.优化CICD:改进 CICD 发布流程,完成CI 和 CD 分离,整合统一利用 jenkins 工具做发布流程化管理。 3.稳 定 性:推动国内智能学习培训系统在容器云中的应用。从零开始搭建容器化平台,实现业务的高可用性,为公司提供了稳定的运营环境,最终使用业务能够承载超过 20 万活跃用户(DAU)。 4.海外支持:参与公司的海外留学业务拓展,及时与代理商和部门技术团队沟通,确保 Kubernetes 容器集群在海外市场的顺利落地,为公司的国际化战略提供了有力的技术支持。

  • 2018-12-01 -2020-04-01北京禧云企业管理有限公司高级运维工程师

    1.运维维护:参与 IDC 机房百台服务器大数据架构改造,完成 Ambari 大数据管理平台落地,使网络与业务数据网络分层,并实现服务快速伸缩部署,监控报警结合于一体。同时参与 Mesos 集群迁移 Kubernetes 容器管理平台,对接数十个业务线,并成功接入自建 SW/TS 发布平台。 2.高效开发:利用 Python、Go 开发运维工具,解决阿里云多区域和七牛云数万台服务器证书自动更新问题,解决数百账号安全问题,解除人工操作,规避账号安全风险,大大提升了运维效率。 3.AIOps :参与根因分析项目,为解决数千条故障信息堆积、处理困难问题,利用多渠道进行数据采集、Janusgraph 图数据存储、架构分析等,并基于链路深度、数量、节点属性等的权重算法,实现快速追踪事故根本因素、故障可自愈,借助智能化的技术提升高可用的能力和效率。 4.入侵防御:通过云账号安全风险把控,从账号风险评估、收缩账号权限、建立业务公共账号方面着手,最大限度降低了账号风险,提前规避未知损失。定期服务器漏洞升级、clamav 杀毒加固本地安全。 5.效能管理:主导跳板机自动化方案落地,与运维开发协作,从

教育经历 和TA聊聊

APP扫码和程序员直接沟通

  • 该用户选择隐藏教育经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看

技能

Kafka
Nginx
K8S
jenkins
0
1
2
3
4
5
0
1
2
3
4
5
作品
应用运维

1. 负责公司的自动化建设,利用bash、python、go开发运维工具,提高运维效率。 2. 参与智能化运维aiops,基于janusgraph图数据展示根因分析,快速追踪事故根本因素,故障自愈,借助智能化的技术提升高可用的能力和效率。

0
2024-03-18 09:46
应用运维

1. 负责大数据生态建设与维护,包括 hadoop、zk、spark、hive、hbase、kafka、flume、sqoop、zeppelin、greenplum等应用,基于数据快速分析出用户画像以及业务响应能力。 2.负责云平台自动化工具开发,实现证书自动更新、监控自动添加、账号安全扫描,解除人工操作,规避账号安全风险,提升了运维效率。 3.负责阿里云平台上云产品和 IDC 机房 维护管理。

0
2024-03-18 09:45
应用运维

承担运维工作 1. 负责 Ludo 业务运维维护管理 ,包括自动化发布、监控、成本管理、稳定性保险 2. 协调沟通测试、研发完成故障演练、安全修复、RCA 报告、微服务上云等工作。 3. 负责 AWS 云平台产品维护管理,包括 EKS、S3、ECS、SLB、VPC等产品。

0
2024-03-18 09:43
更新于: 03-18 浏览: 38