个人介绍
在IaaS与PaaS领域,具备从基础资源抽象到平台能力构建的完整设计经验,能够实现计算、存储、网络及算力资源的统一管理与调度,推动平台能力标准化与服务化,具备平台级架构规划与技术路线制定能力。
在算力与容器化方向,深入参与GPU、NPU、DCU等加速设备在Kubernetes体系下的落地实践,熟悉Device Plugin开发、算力调度优化及多类型硬件资源统一管理,能够解决驱动适配、容器运行时集成及性能瓶颈等关键问题,具备从底层驱动到上层调度的全链路问题处理能力。
在操作系统与基础软件领域,长期从事国产化适配与系统级问题攻关,深入理解Linux内核机制、驱动加载流程、glibc兼容性及复杂运行环境问题,能够完成GPU/NPU相关驱动及运行时组件在多种Linux发行版上的适配与调优,具备系统级排障与性能优化能力。
在云原生领域,精通Kubernetes架构与生态,具备大规模集群部署与优化经验,涵盖网络(Calico/B***)、容器运行时(containerd/docker)、存储及调度机制,能够实现异构算力资源的高效编排与稳定运行。
同时具备网络安全漏洞分析与系统加固能力,熟悉容器逃逸、权限提升及依赖组件漏洞等风险场景,能够结合实际环境进行安全基线建设与风险治理。
技术栈涵盖Python、Java及Shell,具备较强工程能力与复杂问题攻关能力,适合高难度系统设计、算力资源调度优化及关键问题排查类项目交付。
工作经历
2022-07-01 -至今绿盟科技研发工程师
在当前岗位中,负责大数据安全平台的IaaS与PaaS层架构设计与核心模块落地,主导Linux操作系统适配、大数据组件部署与扩缩容方案设计,实现平台在异构算力环境下(GPU/NPU/DCU)的高效调度和弹性扩展。通过构建统一资源调度和安全管理机制,平台能够对计算、存储、网络及算力资源进行全生命周期管理,同时结合访问控制、数据加密、审计日志及权限分级等功能,保障企业数据安全和合规性。在平台功能实现上,设计可视化监控界面,实现任务调度状态、资源利用率及安全事件的实时展示,并提供策略自定义与智能推荐机制,提高运维效率和业务稳定性。此外,负责制定平台扩缩容策略,通过自动化扩展与负载均衡机制,实现大数据节点弹性伸缩和算力动态调配。该项目支撑了金融、电信、政务等高安全性和高可用性业务场景,提升了网络和计算资源的稳定性与可扩展性,并沉淀多项技术方案和专利成果,充分体现了从系统架构、算力管理到安全加固的整体工程能力。
2020-03-01 -2022-06-01烽火通信网络优化工程师
项目描述: 项目面向移动通信网络优化场景,基于现有光纤网络资源,对区域内基站连接关系进行建模与优化,提升网络整体稳定性、链路可靠性及可扩展能力。技术体系涵盖Java开发、MongoDB数据存储、KSP(K最短路径)算法及推荐算法等。 职责与贡献: 作为核心负责人之一,主导技术方案设计与关键模块实现,负责整体优化思路制定与算法落地。在链路优化方面,引入KSP算法对网络拓扑进行建模与多路径计算,实现最优链路选择及冗余路径设计,提升网络容灾能力与稳定性。在端口选择优化方面,基于历史人工配置数据构建训练样本,采用朴素贝叶斯分类算法进行建模,实现节点端口的智能推荐,显著提升配置效率与准确率。 项目成果: 显著优化基站间链路质量与资源利用率,提升网络稳定性与可扩展能力;实现端口配置智能化,降低人工干预成本,为网络规划提供数据化支撑。基于该项目成果,已沉淀多项技术方案,并发表多篇相关专利及论文,具备较强的技术创新与工程转化能力。
教育经历
2019-09-01 - 2022-06-01武汉大学软件工程硕士
软件工程专业,系统学习了数据结构、算法分析、操作系统、计算机网络、数据库原理及软件工程方法论。通过课程项目和实验实践,掌握了面向对象设计、软件开发流程、版本管理及团队协作能力,具备扎实的理论基础和良好的工程实践能力,为从事软件开发、系统架构及运维管理打下坚实基础。
语言

普罗米监控提供完整的云原生管理能力,覆盖集群资源监控、容器状态管理、存储管理、高可用部署和安全策略执行。平台集成Loki日志分析,支持高效日志收集、索引、查询与可视化展示,结合Web前端实现实时监控、告警和运维反馈闭环。系统支持自动扩缩容和弹性调度,实现计算与存储资源的动态调整,保障业务高可用。上传

易用性反馈小程序提供“便捷、可跟踪、可运营”的全流程服务。用户无需内网环境,仅需通过企业*即可快速提交问题,支持文本、截图、日志文件及图片上传。为优化存储与网络效率,小程序自动对图片进行压缩,对日志和上传文件进行清理与归档,确保平台运行稳定。每条反馈均生成唯一编号,实现状态跟踪,包括“已提交、处理







