minapp1733556321小程序-程序员客栈

1月前来过

实习：智能交互大模型算法工程师

北京

全职 · 400/日 · 8700/月信用正常

工作时间: 工作地点: 远程

服务企业: 0家累计提交: 0工时

聊一聊

APP聊一聊

全栈
雅思6.5（阅读8.5）
荣誉奖项：院学习优秀奖学⾦（⼀等）、校级优秀共⻘团员、院级优秀共⻘团⼲部
⼤赛经历：
APMCM 亚太地区⼤学⽣数学建模竞赛-本科组三等奖、东北三省⼤学⽣数学建模联赛-本科组三等奖
⼤连理⼯⼤学数学建模竞赛-本科组⼆等奖

2026-01-15 -2026-06-26美团实习：智能交互大模型算法工程师
美团核⼼本地商业-基础研发平台-智能交互⼤模型算法⼯程师 2026.01-⾄今    迭代优化：构建基于 ReAct 框架的复杂表格问答 Agent（ BA-Table-Agent），在基线模型上应⽤ GSPO、 DAPO、 GRPO 四种 RL 策略进⾏微调优化，
2025-09-30 -2026-01-15阿里巴巴集团-达摩院实习生：大模型算法实习生
2025.09-2026.01  推理研究：开展前沿⼤模型推理研究，围绕知识密集与复杂推理场景，评估 20 余个最新主流模型，揭示不同模型在数学推理、⻓链思维的能⼒差异。复现 MultiChallenge 、
2025-07-01 -2025-09-26好未来实习：大模型项目部-图像算法初级工程师
好未来教育技术体系-⼤模型项⽬部-解题组-图像算法初级⼯程师。 2025.07-2025.09  模型训练优化：基于 OpenRLHF ⼯具，聚焦数学⽂本/图题/⽂本题型分类⽅向，对 Deepseek-R1、 Qwen 系列、 Doubao-V1.6、 GPT-5 等多

2026-09-01 - 2027-11-26香港大学机器人与智能系统（Master of Science in Engineering in Robot硕士
研0，目前暂无经历，下面是大连理工大学项：院学习优秀奖学⾦（⼀等）、校级优秀共⻘团员、院级优秀共⻘团⼲部  ⼤赛经历： APMCM 亚太地区⼤学⽣数学建模竞赛-三等奖、东北三省⼤学⽣数学建模联赛-三等奖、⼤连理⼯⼤学数学建模竞赛⼆等奖  校园经历：⼤连理⼯⼤
2022-09-01 - 2026-06-30大连理工大学软件工程本科
基于分层强化学习的⽆⼈机⽬标识别与跟踪 (2025.04-⾄今)  策略建模：针对⽆⼈机⽬标识别与跟踪中的策略不稳定与奖励稀疏问题，构建 HGR 分层强化学习框架，引⼊状态中继与辅助惩罚机制，优化任务分解与⽬标转移，提升训练效率与策略迁移能⼒。在 AirLearni

Vue熟练

C++精通

Java精通

React精通

MySQL精通

Taro精通

Torch精通

更新于: 03-26 浏览: 12