(1)主要研究方向为多智能体强化学习(2)熟悉单智能体强化学习,完成过强化学习结合NLP实体和关系联合抽取项目;熟悉常见框架如Actor-Critic(3)熟悉多智能体常见算法,MADDPG,MAPPO,熟悉常见问题解决方法,环境非平稳,维度爆炸,奖励稀疏(4)熟悉多智能体零和博弈算法,如蒙特卡洛树搜索等声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论