个人介绍
我是程序员客栈的吴禹轩,一名大模型应用工程师;
我毕业于海南大学,担任过华为OD的算法工程师,担任过华为OD的算法工程师;
负责过医疗教育RAG系统,费马平台RAG系统,知识图谱的开发;
熟练使用Langchain,PyTorch,Qwen,Milvus,vLLM;
如果我能帮上您的忙,请点击“立刻预约”或“发布需求”!
工作经历
2023-09-06 -2025-12-06华为OD软件开发工程师
**吴禹轩**,2023年9月至2025年12月期间在**华为OD**担任**算法工程师**,拥有超过两年的算法实战经验,专注于**大模型应用**与**RAG系统设计**方向。 在职期间,主导设计并落地了多个面向垂直领域的RAG系统,具备从架构设计到算法优化再到模型部署的全链路能力。主要工作成果包括: 1. **医疗教育RAG系统(2025.01-2025.12)**:独立设计了包含高频拦截、意图分类、混合检索与生成在内的五阶段流水线架构。通过三级渐进式拦截算法实现了35%的高频问答命中率,将响应时间从秒级降至20毫秒以内;通过智能策略路由,节省了约30%的检索与生成资源消耗。项目中还完成了BERT-tiny模型的微调与部署,意图分类准确率达95.2%。 2. **测试平台RAG系统(2023.11-2024.09)**:面向代码测试平台构建模块化RAG系统,采用AWQ技术将Qwen2.5-7B模型量化至13GB,精度保持95%,显存占用减少44%;通过vLLM优化推理,吞吐量提升40%。系统覆盖95%的文档内容,新用户上手时间从3天缩短至1天。 3. **医疗知识图谱构建(2023.
教育经历
2019-09-06 - 2023-06-08海南大学软件工程本科






