KKAlphaGoZero
2017年10月nature论文实现 基于TensorFlow
开工日期 2017年12月19日
写的很慢,忙考试,不定期更新
项目结构
-
rule.py ---------- rule父类
-
utils.py --------- 通用工具类
-
go 围棋相关类
- playGo.py -------- 围棋规则类
- showGo.py -------- 提供可视化
- testGo.py -------- 相关测试
-
gobang 五子棋相关类
- gobang.py -------- 五子棋规则类
-
model 网络结构类
- resnet_model.py --------------- resNet的TensorFlow版本
- alphago_zero_resnet_model.py -- alphaGo zero的model
* test_model.py ----------------- model的测试
-
mcts 蒙特卡洛搜索树类
- mcts.py --------------- 蒙特卡洛搜索树
- node.py --------------- 树的节点
- edge.py --------------- 树的边
-
img 项目相关图片
- net_model.jpg ------ AlphaGo Zero的结构图
任务清单
- 围棋规则类(可以下)
- 可视化类
- resNet网络结构类(正向传播)
- MCTS
- 自对弈
- 增强学习
网络结构
参考资料
AlphaGo
MCTS
更新日志
2018年1月14日
拖更十天后重启,完善了mcts部分,特别是增加了狄利克雷噪音,使得和论文一致。
2018年1月4日
准备考试加上元旦休息了一阵,修改了围棋相关类的结构;mcts大体上实现。
2017年12月24日
基本上完成了mcts相关类的结构设计。
2017年12月23日
AlphaGo Zero的model写完了!忙网络的实验忙了一下午也没做完,做这个调节一下心情。
2017年12月22日
对model类注释完毕,并针对此项目进行了部分修改,主要是参数部分。
2017年12月21日
完善了围棋相关类,增加了结算子目和判断真眼的功能;对围棋类增加了针对AlphaGo Zero输入的格式化;对model类增加了注释。
2017年12月19日
花了一个下午,完成PlayGo和ShowGo的编写,即对围棋规则类编写完成,并提供最简单的可视化,其后依据后续需要完善其功能。