全职 · 1000/日 · 21750/月信用正常
工作时间: 工作日20:30-23:30、周末10:30-18:30工作地点:
远程
服务企业:
0家累计提交:
0工时
聊一聊
个人介绍
专注于大模型边缘部署与优化,应用开发
## 技术专长
- LLM 推理优化:量化(PTQ/QAT)、算子融合、KV Cache 优化
- 边缘部署:TPU/NPU/GPU,从嵌入式到云服务器
- 分布式推理:模型切分、通信优化、负载均衡
- 推理引擎:QNN、SNPE、ONNX Runtime、TensorRT、vLLM
## 开源项目
- LangChain-Chatchat-TPU(18⭐):本地知识库问答系统
- ChatDoc-TPU(13⭐):边缘 TPU 部署方案
- WeNet-TPU(6⭐):语音识别 TPU 部署
- 总计 41 个仓库,85+ Stars
## 技术文章
- CSDN 博主:151 篇原创,17k+ 粉丝
- 专栏:并行计算(43 篇)、LLM(18 篇)、强化学习(40 篇)
- 总访问量:50 万+
## 提供服务
1. LLM 边缘部署咨询与开发
2. 模型量化与推理优化
3. 分布式推理架构设计
4. 企业级 AI 系统架构设计
工作经历
2023-07-06 -2026-03-05高通AI软件开发
模型适配, 模型量化,部署,调优,精通NPU, GPU, 专注于大模型优化,语音多模态模型优化,应用搭建 业余开发者,vibe coding 全栈能力
教育经历
2020-09-20 - 2023-06-16东南大学电子信息硕士
资质认证
语言
中文母语水平
英语可口语交流
0
1
2
3
4
5






