环境构建:使用Gazebo与ROS搭建了高自由度的无人机动力学模型,模拟了飞行控制、传感器噪声及复杂障碍环境。算法核心设计:创新性地设计了融合围捕成功率、能量消耗、防碰撞、队形保持的多目标混合奖励函数,有效解决了多智能体训练的信用分配与协同难题。训练与优化:采用Ray/RLlib框架进行分布式训练,
成都华翔智科科技有限责任公司
研发主管
成都智境未来科技有限公司
软件工程师
洛阳蓝普网络技术有限公司
桂林锐新网络科技有限公司
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
使用微信扫一扫