minapp1817402358Java-程序员客栈

5天前在线

研发

北京

全职 · 500/日 · 10875/月信用正常

工作时间: 工作日09:00-21:00工作地点: 远程

服务企业: 0家累计提交: 0工时

聊一聊

APP聊一聊

10 年后端研发经验，近 3 年全职投入 AI 教育产品的工程化落地与商业化运营。

当前作为核心开发者参与 AI 智能交互中台（灵芯平台）的建设，负责 LLM 流式推理、Agent 智能体、RAG 知识

库等核心链路的设计与开发，以及平台稳定性与配置化运营体系的构建。

此前主导了 AI 口语老师、AI 语文老师、AI 教材式英语 3 款基于通义千问大模型的产品从 0 到 1 的全生命周期

交付。在大模型 API 工程化集成、AI 服务高可用保障、模型调用成本优化、灰度发布与全链路监控等方面积累

了完整的生产级实战经验。

具备 Java/php 多语言工程能力，擅长将 AI 模型能力转化为稳定、高效、可运营的产品服务。

2022-01-01 -至今阿里云研发
一、AI 智能交互中台 — 灵芯平台项目概述：面向教育硬件设备（AI 耳机、学习机等）的 AI 能力中台，为设备提供实时语音对话、LLM 智能问答、Agent 智能体、RAG 知识库等核心 AI 能力。基于 Spring Boot + WebFlux 构建，采用 COLA 分层架构，通过WebSocket 实现全双工语音通信，SSE 实现 LLM 流式输出，服务多租户教育硬件厂商。 1. LLM 流式推理接口与多租户模型路由负责文生文（Text-to-Text）流式接口的架构设计与开发，支撑多租户场景下的 LLM 能力输出：流式响应：基于 Spring WebClient + Reactor Netty 实现与 DashScope API（OpenAI 兼容模式）的非阻塞 SSE 流式通信，使用 Flux 处理流式 token 输出，支持思考模式（Thinking）等高级特性多租户模型路由：设计三级 Mapping 路由机制（租户 ID → 模型系列 → 模型版本 → AppKey），通过Nacos 动态配置实现不同租户使用不同模型版本与 API 密钥，支持分钟级在线切换计量

PHP熟练

Java熟练

更新于: 5天前浏览: 7