Flask

项目实现了完整的AlphaZero训练与推理流程,包括自我博弈数据生成、基于MCTS的策略改进、策略-价值联合网络训练以及模型评估对弈。支持多种棋类环境扩展(如井字棋、Connect4),结构清晰,模块解耦,便于替换网络结构或搜索策略,用于强化学习与博弈算法的研究与实验。
690Python人工智能
当前共1个项目more
×
寻找源码
源码描述
联系方式
提交