个人介绍
10 年后端研发经验,近 3 年全职投入 AI 教育产品的工程化落地与商业化运营。
当前作为核心开发者参与 AI 智能交互中台(灵芯平台)的建设,负责 LLM 流式推理、Agent 智能体、RAG 知识
库等核心链路的设计与开发,以及平台稳定性与配置化运营体系的构建。
此前主导了 AI 口语老师、AI 语文老师、AI 教材式英语 3 款基于通义千问大模型的产品从 0 到 1 的全生命周期
交付。在大模型 API 工程化集成、AI 服务高可用保障、模型调用成本优化、灰度发布与全链路监控等方面积累
了完整的生产级实战经验。
具备 Java/php 多语言工程能力,擅长将 AI 模型能力转化为稳定、高效、可运营的产品服务。
工作经历
2022-01-01 -至今阿里云研发
一、AI 智能交互中台 — 灵芯平台 项目概述:面向教育硬件设备(AI 耳机、学习机等)的 AI 能力中台,为设备提供实时语音对话、LLM 智能问答、Agent 智能体、RAG 知识库等核心 AI 能力。基于 Spring Boot + WebFlux 构建,采用 COLA 分层架构,通过WebSocket 实现全双工语音通信,SSE 实现 LLM 流式输出,服务多租户教育硬件厂商。 1. LLM 流式推理接口与多租户模型路由 负责文生文(Text-to-Text)流式接口的架构设计与开发,支撑多租户场景下的 LLM 能力输出: 流式响应:基于 Spring WebClient + Reactor Netty 实现与 DashScope API(OpenAI 兼容模式)的非阻塞 SSE 流式通信,使用 Flux 处理流式 token 输出,支持思考模式(Thinking)等高级特性 多租户模型路由:设计三级 Mapping 路由机制(租户 ID → 模型系列 → 模型版本 → AppKey),通过Nacos 动态配置实现不同租户使用不同模型版本与 API 密钥,支持分钟级在线切换 计量
教育经历
2014-09-01 - 2018-07-01北京邮电大学计算机科学与技术本科



