行业分类人工智能
该作品是论文中的一个实验,讲述的是利用博弈对抗中的遗憾最小化算法改善强化学习中的探索利用问题,可实现算法自适应调整模型在整个学习过程中的探索利用程度,最后算法用在推荐系统里面进行验证效果。
评论
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
使用微信扫一扫
评论