



个人介绍
我是程序员客栈的【昵称】,一名【二级方向】; 我毕业于【临沂大学】,担任过【上海新炬】的【运维工程师】; 负责过【业务容器化与监控升级】,【监控与容量设计】的开发; 熟练使用【k8s】; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2023-08-10 -2025-05-20上海新炬运维工程师
统筹 50+ 台物理服务器及虚拟化平台运维,部署 Prometheus+Grafana 构建全维度监控体系,实现服务器资源、服务状态、网络流量的实时可视化管控; 开发 Shell/Python 自动化脚本,深度赋能日志智能分析、批量配置同步等核心运维场景,大幅提升运维效率;搭建 Harbor 私有镜像仓库,制定容器标准化构建规范,配置 Calico 集群网络与 NFS/Ceph 存储方案,筑牢容器化基础架构;基于 Jenkins 打造自动化流水线,无缝集成 GitLab 代码仓库,建立 SonarQube 代码质量扫描机制,构建完整 DevOps 闭环。
教育经历
2019-09-01 - 2023-06-30临沂大学计算机应用技术本科
语言
技能

容器化 • 选用 RKE2 做底座,先在测试场站跑通 18 个微服务,验证后再扩展到 4 个业务域。 • 用 Helm 做模板,GitLab CI 做流水线,把原来需要 2 周的升级压缩到 1-2 天。 • 边缘节点网络不稳,加了 DaemonSet 方式的离线缓存,断网 2 h 内业务不断。 日志 • 统一用 Filebeat → Kafka → ClickHouse 的链路,把 14 种日志格式收敛成 3 种(access、app、audit)。 • 热数据 3 天、冷数据 90 天自动转储到 MinIO,磁盘成本降 40%。 • 做了基于日志的环控告警:风机异常日志 1 分钟内触发企业*,比原来人工巡检提前 15 min。 监控 • Prometheus + Grafana 做基础监控,先拉通 CPU、内存、JVM、MQ 指标。 • 用 blackbox_exporter 补上 200 多个关键接口的可用性探针,告警误报率从 30% 降到 5%。 • 结合日志里的 trace-id,把排障链路可视化,定位接口超时平均耗时从 45 min 降到 12 min。 结果 • 核心系统容器化比例 30% → 85%,发布效率提升约 8 倍。 • 日志查询从 5 个入口集中到 1 个,90% 问题可在 10 min 内定位。 • 2024 年春节高峰,系统无重大故障,运维值班人数由 4 人/班减到 2 人/班。
