火火
3天前在线
全职 · 300/日  ·  6525/月
工作时间: 周末09:00-17:30工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

熟悉端侧 + 云端双端模型全流程部署与深度性能优化,擅长多模态大模型、目标检测、单目 / 双目深度估计等模型工程化落地;熟练掌握相机标定、3D 空间定位、视觉系统搭建,具备端云一体化落地能力。

工作经历

  • 2025-07-04 -至今小米科技算法工程师

    1. C700旗舰摄像头视频理解模型服务性能优化 负责C700旗舰摄像头Qwen3-VL多模态大模型云端部署推理优化,主要工作内容包括: (1)ViT编码器深度调优:通过模型重构、INT8量化、TensorRT推理、CUDA双流水线、位置编码缓存,大幅降低部署成本; (2)CUDA高性能算子开发:开发高性能注意力算子,解决FlashAttention分块计算、bit-packed掩码压缩问题,实现精度无损替换; (3)云端部署优化:基于 vLLM 推理框架完成 Qwen3-VL 多模态大模型的云端部署,实现推理流程优化与推理参数调优;并通过 Nsys 工具持续定位性能瓶颈,针对性完成问题排查与性能提升。  推理QPS从3.68提升至9.45,吞吐涨幅157%,大幅降低部署成本。核心看护场景精度无损,整体精度损失<1%,达成优化目标。 2. 全屋智能多设备联动标定 搭建多设备自动化联动标定方案,解决全屋智能项目获取全局定位信息难题,主要工作内容包括: (1)搭建联动标定全流程pipeline:针对扫地机与摄像头跨设备协同场景,设计自动化标定方案,完成多场景实测验证。 (2)融

教育经历

  • 2022-09-01 - 2025-06-30武汉理工大学机械工程硕士

  • 2018-09-01 - 2022-06-30武汉理工大学机械工程本科

资质认证

语言

中文母语水平
英语无工具书面交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

C++掌握
Android掌握
Torch熟练
IoT掌握
0
1
2
3
4
5
0
1
2
3
4
5
更新于: 3天前 浏览: 1