个人介绍
3年AI大模型应用工程师 | 专注LLM工程化落地与可交付产品
擅长将大模型能力转化为企业可用的真实系统,不做Demo只做上线方案。
✅ 核心服务:
• 企业RAG知识库问答(PDF/Word/Excel→AI问答,LangChain+Chroma/Milvus+Rerank)
• OpenAI/Claude/DeepSeek/Qwen 多模型统一接入与Prompt优化
• AI Agent工具调用(Function Calling)、自动化工作流
• 私有化大模型部署(vLLM/Ollama,内网离线环境)
✅ 已交付:RAG客服知识库×3、内部文档问答系统×2、API统一网关×1
✅ 技术栈:Python · FastAPI · LangChain · LlamaIndex · Chroma/Milvus · Docker
✅ 承诺:源码完整交付·文档齐全·签NDA·售后答疑
可承接短期调试/咨询,也可全程负责中型项目开发。
工作经历
2025-07-09 -至今汇丰银行 HSBCAI大模型应用工程师
负责 智能客服与智能工单系统 的 NLP 模块开发,支撑信用卡、贷款、跨境业务场景 将传统规则 + TF-IDF 架构升级为 BERT + 向量检索,意图识别准确率提升 28%,误判率显著下降 基于 Spring Boot + Python 搭建模型推理服务,优化 GPU 资源调度,推理成本降低 35% 参与设计并落地 多轮对话管理引擎,支持上下文记忆、意图跳转与异常处理 推动模型监控体系建设(准确率、延迟、异常预警),保障生产环境稳定运行
2022-07-01 -2025-04-30星展银行 DBS BankAI大模型应用工程师
基于 LangChain + FAISS / Milvus 构建 银行内部知识库问答系统,覆盖信贷政策、合规手册、产品文档,支持 PDF / Word / Excel 多格式解析 引入 Hybrid Search(向量 + 关键词) + Rerank 重排序,将问答准确率从 72% 提升至 93%,有效降低幻觉风险 封装 多模型统一调用层(OpenAI / Claude / 本地私有模型),实现模型热切换、Token 用量统计与成本控制 开发 合规风控 Agent,通过 Function Calling 自动校验业务流程是否符合监管规则,减少人工审核工作量约 40% 使用 FastAPI + Docker 完成内网私有化部署,满足银行数据安全与审计要求
2019-07-15 -2022-06-30逸仙电商Java高级工程师
负责 电商核心交易链路 设计与开发,涵盖商品中心、订单中心、促销系统与库存扣减,支撑 双11 / 618 千万级流量场景 基于 Spring Boot + Spring Cloud Alibaba 搭建微服务架构,使用 Nacos + Sentinel + RocketMQ 实现服务治理、限流与异步解耦 主导 订单分库分表改造(Sharding-JDBC),单表数据量由 8000 万降至 1000 万以内,查询性能提升 4 倍 设计 分布式事务解决方案(可靠消息最终一致性),解决下单、支付、库存扣减的一致性问题 使用 Redis + Lua 实现高并发库存扣减与防超卖,支撑秒杀活动 QPS 峰值 3 5w+ 推动 API 网关统一鉴权、限流、日志追踪,为后续数据中台与算法系统提供标准化接口
教育经历
2015-09-01 - 2019-06-30湘潭大学计算机科学与技术本科



