proginn1101023680
1天前在线
全职 · 500/日  ·  10875/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

3年AI大模型应用工程师 | 专注LLM工程化落地与可交付产品


擅长将大模型能力转化为企业可用的真实系统,不做Demo只做上线方案。


✅ 核心服务:

• 企业RAG知识库问答(PDF/Word/Excel→AI问答,LangChain+Chroma/Milvus+Rerank)

• OpenAI/Claude/DeepSeek/Qwen 多模型统一接入与Prompt优化

• AI Agent工具调用(Function Calling)、自动化工作流

• 私有化大模型部署(vLLM/Ollama,内网离线环境)


✅ 已交付:RAG客服知识库×3、内部文档问答系统×2、API统一网关×1

✅ 技术栈:Python · FastAPI · LangChain · LlamaIndex · Chroma/Milvus · Docker

✅ 承诺:源码完整交付·文档齐全·签NDA·售后答疑


可承接短期调试/咨询,也可全程负责中型项目开发。

工作经历

  • 2025-07-09 -至今汇丰银行 HSBCAI大模型应用工程师

    负责 智能客服与智能工单系统​ 的 NLP 模块开发,支撑信用卡、贷款、跨境业务场景 将传统规则 + TF-IDF 架构升级为 BERT + 向量检索,意图识别准确率提升 28%,误判率显著下降 基于 Spring Boot + Python​ 搭建模型推理服务,优化 GPU 资源调度,推理成本降低 35% 参与设计并落地 多轮对话管理引擎,支持上下文记忆、意图跳转与异常处理 推动模型监控体系建设(准确率、延迟、异常预警),保障生产环境稳定运行

  • 2022-07-01 -2025-04-30星展银行 DBS BankAI大模型应用工程师

    基于 LangChain + FAISS / Milvus​ 构建 银行内部知识库问答系统,覆盖信贷政策、合规手册、产品文档,支持 PDF / Word / Excel 多格式解析 引入 Hybrid Search(向量 + 关键词) + Rerank 重排序,将问答准确率从 72% 提升至 93%,有效降低幻觉风险 封装 多模型统一调用层(OpenAI / Claude / 本地私有模型),实现模型热切换、Token 用量统计与成本控制 开发 合规风控 Agent,通过 Function Calling 自动校验业务流程是否符合监管规则,减少人工审核工作量约 40% 使用 FastAPI + Docker​ 完成内网私有化部署,满足银行数据安全与审计要求

  • 2019-07-15 -2022-06-30逸仙电商Java高级工程师

    负责 电商核心交易链路​ 设计与开发,涵盖商品中心、订单中心、促销系统与库存扣减,支撑 双11 / 618​ 千万级流量场景 基于 Spring Boot + Spring Cloud Alibaba​ 搭建微服务架构,使用 Nacos + Sentinel + RocketMQ​ 实现服务治理、限流与异步解耦 主导 订单分库分表改造(Sharding-JDBC),单表数据量由 8000 万降至 1000 万以内,查询性能提升 4 倍 设计 分布式事务解决方案(可靠消息最终一致性),解决下单、支付、库存扣减的一致性问题 使用 Redis + Lua​ 实现高并发库存扣减与防超卖,支撑秒杀活动 QPS 峰值 3 5w+ 推动 API 网关统一鉴权、限流、日志追踪,为后续数据中台与算法系统提供标准化接口

教育经历

  • 2015-09-01 - 2019-06-30湘潭大学计算机科学与技术本科

资质认证

语言

英语可口语交流
0
1
2
3
4
5

技能

Python精通
Java精通
0
1
2
3
4
5
0
1
2
3
4
5
更新于: 1天前 浏览: 2