本文主要以无人驾驶为目标,对几种深度强化学习算法进行研究。具体研究成果如下:
1. 对A3C(Asynchronous Advantage Actor-Critic),DDPG(Deep Deterministic Policy Gradient),SAC(Soft Actor-Critic)三种算法在无人驾驶问题中的优缺点进行了分析,并且针对无人驾驶问题对算法进行修改和应用。将三种算法应用到模拟器上进行实验,分析不同参数下的表现与结果。重点研究了SAC算法中熵权重因子α和奖励函数的变化对于驾驶行为的影响。
2. 实现了无人驾驶系统,在对驾驶模拟器环境中的智能体进行训练和验证的基础上,探讨将算法模型移植到真实小车无人驾驶环境的方案,通过提供通用的gym应用接口,同时支持模拟环境和真实驾驶环境的算法研究和软件部署。
3. 提出了通过CGAN (Conditional Generative Adversarial Network)来将模拟器中得到的算法模型迁移到真实环境的方案,探讨并实现了通过VAE (Variational Autoencoder)技术来对场景图像进行降维,以提升训练和