个人介绍
我是程序员客栈的【箩卜】,一名【android 多模态开发】; 先后在吉利亿咖通、阿里集团-斑马智行,蚂蚁集团-支付宝,担任过高级工程师 负责过【车载语音】,【语音音箱】,【ai智能助手】的开发; 熟练使用【java】,【kotlin】,【C++】,熟练开发【ASR、TTS】,【视觉识别】; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2025-01-06 -至今支付宝高级工程师
进入蚂蚁客户端团队,先后负责 GPS、TTS 支持 AI agent 模式、act 点咖啡、DeepSeek 接入等功能;后业务方向调整,团队从 0-1 搭建灵光 App,后进行vibeCoding 改造,搭建相关能力skill ,接口契约、状态机文档、监控大盘查询等沉淀为团队 Skill 或模板仓库。
2021-04-30 -2025-12-31斑马网络智行语音高级工程师
负责承接天猫精灵语音车载业务,快速上手,独立完成语音应用的音频流厂商更换、天猫精灵技能开发并承担起团队技术文档建设,获得领导、客户的一致好评。 参与AliOS 语音引擎能力安卓原子化,负责各个语音模块的JNI、SDK开发以及承担安卓语音助手应用TPM一角,后续在宝马语音SDK中负责负责宝马研发技术实现对接。进入语音工程框架团队,负责对话管理,语音交互层,在宝马项目中,先后落地多语言、多意图、大模型流式播报、主驾全时全双工、VUI交互等功能,目前宝马已经量产两款车型。
教育经历
2012-09-03 - 2016-06-01南京理工大学网络工程本科
资质认证
语言
技能

1.参与多种AIAgent场景的方案设计与落地,包括语音交互式Agent、轻应用TTS长卡流式播报Agent、图生图/图生视频创作Agent、文生音乐Agent、闪应用类Agent等。2.主对话支持语音、文字、图片等多模态交互,设计了一个基于事件驱动的状态机,对用户完整交互过程进行状态切换和编排,为

1.分析功能需求、设计实现方案并推进落地实施,整体应用状态负责;2.负责声音克隆和手势识别JNI模块的封装、应用功能开发3.负责唤醒、ASR、TTS等原子能力封装、API设计、示例实现、开放平台对接4.端对端急速语音专项性能调优5.公版VUI方案制定和开发







