火火人工智能-程序员客栈

1月前来过

算法工程师

武汉

全职 · 300/日 · 6525/月信用正常

工作时间: 周末09:00-17:30工作地点: 远程

服务企业: 0家累计提交: 0工时

聊一聊

APP聊一聊

熟悉端侧 + 云端双端模型全流程部署与深度性能优化，擅长多模态大模型、目标检测、单目 / 双目深度估计等模型工程化落地；熟练掌握相机标定、3D 空间定位、视觉系统搭建，具备端云一体化落地能力。

2025-07-04 -至今小米科技算法工程师
1. C700旗舰摄像头视频理解模型服务性能优化负责C700旗舰摄像头Qwen3-VL多模态大模型云端部署推理优化，主要工作内容包括：（1）ViT编码器深度调优：通过模型重构、INT8量化、TensorRT推理、CUDA双流水线、位置编码缓存，大幅降低部署成本；（2）CUDA高性能算子开发：开发高性能注意力算子，解决FlashAttention分块计算、bit-packed掩码压缩问题，实现精度无损替换；（3）云端部署优化：基于 vLLM 推理框架完成 Qwen3-VL 多模态大模型的云端部署，实现推理流程优化与推理参数调优；并通过 Nsys 工具持续定位性能瓶颈，针对性完成问题排查与性能提升。推理QPS从3.68提升至9.45，吞吐涨幅157%，大幅降低部署成本。核心看护场景精度无损，整体精度损失＜1%，达成优化目标。 2. 全屋智能多设备联动标定搭建多设备自动化联动标定方案，解决全屋智能项目获取全局定位信息难题，主要工作内容包括：（1）搭建联动标定全流程pipeline：针对扫地机与摄像头跨设备协同场景，设计自动化标定方案，完成多场景实测验证。（2）融

中文母语水平

英语无工具书面交流

C++掌握

Torch熟练

IoT掌握

更新于: 03-27 浏览: 25