个人介绍
雅思6.5(阅读8.5)
荣誉奖项: 院学习优秀奖学⾦( ⼀等) 、 校级优秀共⻘团员、 院级优秀共⻘团⼲部
⼤赛经历:
APMCM 亚太地区⼤学⽣数学建模竞赛-本科组三等奖、 东北三省⼤学⽣数学建模联赛-本科组三等奖
⼤连理⼯⼤学数学建模竞赛-本科组⼆等奖
工作经历
2026-01-15 -2026-06-26美团实习:智能交互大模型算法工程师
美团 核⼼本地商业-基础研发平台-智能交互⼤模型算法⼯程师 2026.01-⾄今 迭代优化: 构建基于 ReAct 框架的复杂表格问答 Agent( BA-Table-Agent) , 在基线模型上应⽤ GSPO、 DAPO、 GRPO 四种 RL 策略进⾏微调优化,
2025-09-30 -2026-01-15阿里巴巴集团-达摩院实习生:大模型算法实习生
2025.09-2026.01 推理研究: 开展前沿⼤模型推理研究 , 围绕知识密集与复杂推理场景, 评估 20 余个最新主流模型, 揭示 不同模型在数学推理、 ⻓链思维的能⼒差异。 复现 MultiChallenge 、
2025-07-01 -2025-09-26好未来实习:大模型项目部-图像算法初级工程师
好未来教育 技术体系-⼤模型项⽬部-解题组-图像算法初级⼯程师。 2025.07-2025.09 模型训练优化: 基于 OpenRLHF ⼯具, 聚焦数学⽂本/图题/⽂本题型分类⽅向, 对 Deepseek-R1、 Qwen 系列、 Doubao-V1.6、 GPT-5 等多
教育经历
2026-09-01 - 2027-11-26香港大学机器人与智能系统(Master of Science in Engineering in Robot硕士
研0,目前暂无经历,下面是大连理工大学项: 院学习优秀奖学⾦( ⼀等) 、 校级优秀共⻘团员、 院级优秀共⻘团⼲部 ⼤赛经历: APMCM 亚太地区⼤学⽣数学建模竞赛-三等奖、 东北三省⼤学⽣数学建模联赛-三等奖、 ⼤连 理⼯⼤学数学建模竞赛⼆等奖 校园经历: ⼤连理⼯⼤
2022-09-01 - 2026-06-30大连理工大学软件工程本科
基于分层强化学习的⽆⼈机⽬标识别与跟踪 (2025.04-⾄今) 策略建模: 针对⽆⼈机⽬标识别与跟踪中的策略不稳定与奖励稀疏问题, 构建 HGR 分层强化学习框架, 引⼊状态中继与辅助惩罚机制, 优化任务分解与⽬标转移, 提升训练效率与策略迁移能⼒。 在 AirLearni


