提出一种基于强化学习的交叉路口信号协调控制 车流量,车辆等待时间以及每条道路车辆等待长度为Reward,信号灯相位为Action,基于环境交互来调整Actor和Critic网络从而获得收益最大化
评论
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
使用微信扫一扫
评论