proginn1101023680人工智能-程序员客栈

1天前在线

D级

AI大模型应用工程师

广州

全职 · 500/日 · 10875/月信用一般

工作时间: 工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

3年AI大模型应用工程师 | 专注LLM工程化落地与可交付产品

擅长将大模型能力转化为企业可用的真实系统，不做Demo只做上线方案。

✅ 核心服务：

• 企业RAG知识库问答（PDF/Word/Excel→AI问答，LangChain+Chroma/Milvus+Rerank）

• OpenAI/Claude/DeepSeek/Qwen 多模型统一接入与Prompt优化

• AI Agent工具调用（Function Calling）、自动化工作流

• 私有化大模型部署（vLLM/Ollama，内网离线环境）

✅ 已交付：RAG客服知识库×3、内部文档问答系统×2、API统一网关×1

✅ 技术栈：Python · FastAPI · LangChain · LlamaIndex · Chroma/Milvus · Docker

✅ 承诺：源码完整交付·文档齐全·签NDA·售后答疑

可承接短期调试/咨询，也可全程负责中型项目开发。

2025-07-09 -至今汇丰银行 HSBCAI大模型应用工程师
负责智能客服与智能工单系统的 NLP 模块开发，支撑信用卡、贷款、跨境业务场景将传统规则 + TF-IDF 架构升级为 BERT + 向量检索，意图识别准确率提升 28%，误判率显著下降基于 Spring Boot + Python 搭建模型推理服务，优化 GPU 资源调度，推理成本降低 35% 参与设计并落地多轮对话管理引擎，支持上下文记忆、意图跳转与异常处理推动模型监控体系建设（准确率、延迟、异常预警），保障生产环境稳定运行
2022-07-01 -2025-04-30星展银行 DBS BankAI大模型应用工程师
基于 LangChain + FAISS / Milvus 构建银行内部知识库问答系统，覆盖信贷政策、合规手册、产品文档，支持 PDF / Word / Excel 多格式解析引入 Hybrid Search（向量 + 关键词） + Rerank 重排序，将问答准确率从 72% 提升至 93%，有效降低幻觉风险封装多模型统一调用层（OpenAI / Claude / 本地私有模型），实现模型热切换、Token 用量统计与成本控制开发合规风控 Agent，通过 Function Calling 自动校验业务流程是否符合监管规则，减少人工审核工作量约 40% 使用 FastAPI + Docker 完成内网私有化部署，满足银行数据安全与审计要求
2019-07-15 -2022-06-30逸仙电商Java高级工程师
负责电商核心交易链路设计与开发，涵盖商品中心、订单中心、促销系统与库存扣减，支撑双11 / 618 千万级流量场景基于 Spring Boot + Spring Cloud Alibaba 搭建微服务架构，使用 Nacos + Sentinel + RocketMQ 实现服务治理、限流与异步解耦主导订单分库分表改造（Sharding-JDBC），单表数据量由 8000 万降至 1000 万以内，查询性能提升 4 倍设计分布式事务解决方案（可靠消息最终一致性），解决下单、支付、库存扣减的一致性问题使用 Redis + Lua 实现高并发库存扣减与防超卖，支撑秒杀活动 QPS 峰值 3 5w+ 推动 API 网关统一鉴权、限流、日志追踪，为后续数据中台与算法系统提供标准化接口

2015-09-01 - 2019-06-30湘潭大学计算机科学与技术本科

Vibe Coding

英语可口语交流

Python精通

Java精通

更新于: 1天前浏览: 2

个人介绍

工作经历

教育经历

资质认证

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐