环境构建:使用Gazebo与ROS搭建了高自由度的无人机动力学模型,模拟了飞行控制、传感器噪声及复杂障碍环境。算法核心设计:创新性地设计了融合围捕成功率、能量消耗、防碰撞、队形保持的多目标混合奖励函数,有效解决了多智能体训练的信用分配与协同难题。训练与优化:采用Ray/RLlib框架进行分布式训练,
技术总监
杭州新软科技研究所
高级开发工程师
杭州此一信息科技有限公司
技术工程师
湖南曲微科技有限公司
江门文卓信息科技有限公司