1、项目功能模块:
- 中国象棋规则引擎:完整实现棋子走法生成、将军检测、和棋判定、长将/长捉违规裁定
- CNN残差网络:策略头(预测走子概率)+价值头(预测局面胜负),支持tiny(64f/3b)、mid(128f/5b)、full(256f/10b)三档配置
- MCTS蒙特卡洛树搜索:UCB探索策略、Dirichlet噪声注入、虚拟损失并行搜索
- 强化学习自对弈训练管线:自对弈数据收集→复盘缓冲区存储→网络权重更新→Arena对战评估,闭环自动化
- 对战GUI:Pygame棋盘界面,中文棋子渲染,支持人机对战与鼠标点击走棋
- 断点续跑:optimizer/scheduler/ReplayBuffer全状态保存恢复,Ctrl+C任意中断后无缝接续
2、项目主要功能:
从零手写AlphaZero架构,不依赖任何象棋或强化学习框架。输入棋局状态,MCTS搜索输出最佳走法。训练管线支持自对弈数据自动生成、网络迭代更新、Arena胜率评估,可无限续跑。GUI界面可直接与AI对弈。
点击空白处退出提示











评论