大石头专业运维
全职 · 500/日  ·  10875/月
工作时间: 工作日08:30-21:30、周末09:30-18:30工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的小石头,一名专业运维工程师; 我毕业于杭州电子科技大学,担任过多家上市互联网公司的运维工程师岗位; 熟练使用 Linux docker k8s python Prometheus 和大数据等技术栈;

熟悉阿里云 华为云 亚马逊云等公有云平台。

我能为您提供项目私有化交付 数据迁移上云 基于Jenkins实现CICD流水线部署 SAAS平台K8S容器化部署和维护 数据库性能优化 可观测监控平台搭建 组建大数据机柜机房等。 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2023-09-12 -至今杭州人瑞人力资源有限公司sre

    1 负责两轮充电平台和运营云物联网平台的运维保障和技术支持,保障平台SLA达到99%的可用性。 2 负责物联网平台版本发布,配置变更,监控告警系统建设。 3 负责发版流程和操作规范SOP制定,自动化流水线建设。 4 负责枪机 球机 NVR 烟感设备 充电桩主机 热成像 跌倒雷达 行车记录仪等设备接入物联网平台技术验证及POC演示场景构建。 5 负责设备接入平台ICC /C9100/乐橙/指令集OS平台的部署和日常维护。 6 负责迪拜 巴西等海外项目的物联网平台的私有化交付。 7 负责充电桩 智慧用电 有赞商城等小程序和公众号的备案和年审。 8 负责对接等保2.0现场评审及资质获取。 9 负责大数据魔方系统的部署和日常维护。

  • 2021-07-08 -2023-08-09杭州座头鲸科技有限公司devops

    1负责屈臣氏 星巴克 无印良品等项目的私有化交付和后期的运维支撑,快速响应并解决问题。 2完成阿里云所有资产按产品线划分归属和财务单元,为控制财务成本支出提供数据支撑。 3完成定时任务由crontab迁移到airflow,集中管理和调度定时任务,并提供可视化能力。 4配合第三方测评机构完成等保3.0现场评审,取得等保3.0认证,提升网络安全和合规性资质。 5负责部署和维护大数据CDH平台,并完成相关组件log4j2漏洞修复。 6输出多项运维操作SOP,促进生产环境发版及数据变更等操作规范化,显著降低客户RCA投诉。 7优化Postgresql数据库参数,tps提升接近1.5倍,减少了下游DMP合作方查询出现膨胀的几率。 8优化链路追踪系统jaeger的存储,配置es索引生命周期策略,提高jaeger稳定性和可用性。 9完成各个系统的kafka在线滚动平滑升级,版本由0.10.2.0升级到2.13-2.8.1 。 10调研CDH迁移到阿里云EMR并对接LDAP,实现账号集中认证,hbase精确到表的行和列权限控制。 11将flink由Standalone模式变更为Per Job Clus

  • 2020-03-03 -2021-07-13上海富数科技有限公司高级运维工程师

    1主导离线交付系统的研发。 2搭建和维护各个环境的kubernetes集群。 3调研kubesphere k3s rancher,输出标准化的k8s快速交付方案。 4编写各个服务的dockerfile ,持续优化各个服务的YAML编排模板。 5编写安全隐私计算平台各个系统的一键离线部署脚本。 6负责对客户的交付方案制定和网络架构拓扑设计。 7负责prometheus监控和告警平台建设。 8负责和客户前期对接系统架构及交付功能拟定,后期快速解决客户的需求和问题。 9输出redis mysql mq fastdfs spark集群的离线部署脚本,满足集群水平扩容需求。

  • 2018-03-07 -2020-01-06浙江亿咖通科技有限公司高级运维工程师

    1负责阿里云VPC网络的规划以及阿里云内网和吉利集团内网的互通。 2参与上海和广西机房的建设调试,网络线路和路由节点的可用性监控和故障通知。 3参与微服务基础设施kubernetes集群架构的制定和落地。 4部署apollo多环境高可用集群,实现配置项的灰度发布,热更新,配置项变更审核。 5制定日志规范和实现日志不落盘采集,减少磁盘性能开销和空间占用。 6配置日志清洗规则和数据集展示大盘,并根据日志监控条件触发告警通知。 7完成Jenkins CI/CD平台建设。

  • 2016-03-01 -2018-02-06杭州兑吧网络科技有限公司 高级运维工程师

    1负责生产环境的日常更新发版和活动日服务器扩容。 2推动开发环境和测试环境采用docker容器化部署。 3维护confluence jira gitlab jenkins walle jumpserver 等运维平台。 4参与核心业务http到https的改造,申请SSL证书,配置nginx的证书卸载。 5负责完成openfalcon 监控告警体系的建设和完善。 6负责公司内部机房KVM虚拟化集群的安装配置和日常维护。 7负责大数据机房建设,服务器采购,机架分配,光纤网络和系统调试。 8升级线上各个环境的Java JDK版本到1.8 。 9调研和试推行腾讯开源自动化运维平台BLUE KING 。 10制定代码分支管理策略,提高研发同学协作开发的效率。

  • 2014-03-05 -2016-01-05杭州顺网科技股份有限公司环境配置工程师

    1负责BU1和BU4业务线下面的网维大师,游戏详情页,游戏活动页,Passport充值等业务的日常更新部署和环境搭建,包括代码更新,sql更新,配置更新,预发环境搭建和维护。 2参与windows和linux客户端程序的打包签名和安装包制作,参与近百台服务器的虚拟化集群维护,包括机器上架前做raid稳定性测试 ,安装配置ESXi,机房网络变更等,还有虚拟机迁移,模板制作,资源池分配,资产整理等工作。

教育经历

  • 2009-09-10 - 2013-05-15杭州电子科技大学计算机科学与技术本科

语言

普通话
英语
0
1
2
3
4
5
0
1
2
3
4
5

技能

K8S
Zabbix
Falcon prometheus
Jenkins
0
1
2
3
4
5
0
1
2
3
4
5
作品
任职于座头鲸公司devops岗位

1 完成定时任务由crontab迁移到airflow,集中管理和调度定时任务,并提供可视化能力。 2 配合第三方测评机构完成等保3.0现场评审,取得等保3.0认证,提升网络安全和合规性资质。 3 负责部署和维护大数据CDH平台。 4 输出多项运维操作SOP,促进生产环境发版及数据变更等操作规范化,显著降低客户RCA投诉。 5 优化Postgresql数据库参数,tps提升接近1.5倍,减少了下游DMP合作方查询出现膨胀的几率。 6 编写各个模块和中间件的K8S编排及ansible一键部署脚本,提高客户现场离线部署效率。

0
2025-05-18 09:47
更新于: 05-17 浏览: 52