(1)主要研究方向为多智能体强化学习
(2)熟悉单智能体强化学习,完成过强化学习结合NLP实体和关系联合抽取项目;熟悉常见框架如Actor-Critic
(3)熟悉多智能体常见算法,MADDPG,MAPPO,熟悉常见问题解决方法,环境非平稳,维度爆炸,奖励稀疏
(4)熟悉多智能体零和博弈算法,如蒙特卡洛树搜索等
点击空白处退出提示
(1)主要研究方向为多智能体强化学习
(2)熟悉单智能体强化学习,完成过强化学习结合NLP实体和关系联合抽取项目;熟悉常见框架如Actor-Critic
(3)熟悉多智能体常见算法,MADDPG,MAPPO,熟悉常见问题解决方法,环境非平稳,维度爆炸,奖励稀疏
(4)熟悉多智能体零和博弈算法,如蒙特卡洛树搜索等



评论