个人介绍
14年金融核心系统基础设施保障经验,服务于邮储银行数据中心,保障日均亿级交易量渠道系统的 7×24 小时稳定运行。在数据库运维(PostgreSQL / Oracle / MySQL)、监控体系搭建、灾备高可用、自动化工具开发等方向有深入实践。对重复性工作有本能的优化冲动,主导开发过自动化运维平台,用脚本和工具替代人工操作,效率提升 50% 以上。目前正在将这种自动化本能延伸到 AI 方向,实践大模型本地部署、微调与量化,探索 AI 在运维场景中的落地可能。
工作经历
2016-01-02 -2026-06-30新晨科技股份有限公司技术支持部项目经理
担任邮储事业部技术支持部项目经理,负责邮储银行数据中心现场约 30 人驻场团队的管理,统筹 6 个重要信息系统(3 大渠道:传统渠道、电子渠道、企业渠道;2 大客服:信用卡客服、远程银行客服;国际支付前置)的日常运维保障,系统日均交易量上亿级。 •团队搭建与培养:负责驻场团队的人员招聘、梯队建设与技术培训,建立起覆盖多系统、多角色的运维保障能力,确保团队能够支撑 7×24 小时不间断服务。 •故障应急体系优化:梳理并优化了故障应急响应流程,缩短故障定位与恢复时间。制定分级告警策略与标准化应急预案,建立故障复盘机制,推动问题从被动响应转向主动预防。 •运维流程标准化:主导制定了各系统的运维 SOP 和生产运行手册,将核心操作流程(变更发布、日终跑批、巡检等)从依赖个人经验转为可复制、可交接的标准化作业,降低人员流动带来的风险。 •自动化工具推广:在团队内推动自动化巡检、日志分析、批量作业等工具的落地使用,减少人工重复操作,将日常运维效率提升 50% 以上。 •监控告警体系优化:根据数据中心监控指标要求,推动各系统监控覆盖率的提升,完善指标采集、日志聚合和链路追踪能力,实现从系统级到业务级
教育经历
2008-09-01 - 2012-07-01中国防卫科技学院酒店管理本科
资质认证
语言

封装32项K8s运维能力,覆盖四大类:核心资源管理(Pod、Deployment、Service、Node、存储、Ingress等)、运维操作(日志、监控、事件分析、远程执行、端口转发)、安全与分析(RBAC、网络策略、安全审计、健康检查、拓扑、成本分析)、主机巡检。提供MCPServer、CLI命




