AlphaZero implementation for Othello, Connect-Four and Tic-Tac-Toe based on "Mastering the game of Go without human knowledge" and "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm" by DeepMind.

Stars: ✭ 68 (+94.29%)

Mutual labels: alphago-zero

connect4-alpha-zero

Connect4 reinforcement learning by AlphaGo Zero methods.

Stars: ✭ 102 (+191.43%)

Mutual labels: alphago-zero

sai

SAI: a fork of Leela Zero with variable komi.

Stars: ✭ 92 (+162.86%)

Mutual labels: alphago-zero

saltzero

Machine learning bot for ultimate tic-tac-toe based on DeepMind's AlphaGo Zero paper. C++ and Python.

Stars: ✭ 27 (-22.86%)

Mutual labels: alphago-zero

connect4

Solving board games like Connect4 using Deep Reinforcement Learning

Stars: ✭ 33 (-5.71%)

Mutual labels: alphago-zero

alphaFive

alphaGo版本的五子棋(gobang, gomoku)

Stars: ✭ 51 (+45.71%)

Mutual labels: alphago-zero

alphazero

Board Game Reinforcement Learning using AlphaZero method. including Makhos (Thai Checkers), Reversi, Connect Four, Tic-tac-toe game rules

Stars: ✭ 24 (-31.43%)

Mutual labels: alphago-zero

MyAlphaGoZeroOnConnect4

My Simple Implementation of AlphaGo Zero on Connect4

Stars: ✭ 16 (-54.29%)

Mutual labels: alphago-zero

KKAlphaGoZero

2017年10月nature论文实现基于TensorFlow
开工日期 2017年12月19日写的很慢，忙考试，不定期更新

项目结构

rule.py ---------- rule父类
utils.py --------- 通用工具类
go 围棋相关类
- playGo.py -------- 围棋规则类
- showGo.py -------- 提供可视化
- testGo.py -------- 相关测试
gobang 五子棋相关类
- gobang.py -------- 五子棋规则类
model 网络结构类
- resnet_model.py --------------- resNet的TensorFlow版本
- alphago_zero_resnet_model.py -- alphaGo zero的model
  * test_model.py ----------------- model的测试
mcts 蒙特卡洛搜索树类
- mcts.py --------------- 蒙特卡洛搜索树
- node.py --------------- 树的节点
- edge.py --------------- 树的边
img 项目相关图片
- net_model.jpg ------ AlphaGo Zero的结构图

任务清单

网络结构

参考资料

AlphaGo

MCTS

蒙特卡洛搜索树

更新日志

2018年1月14日

拖更十天后重启，完善了mcts部分，特别是增加了狄利克雷噪音，使得和论文一致。

2018年1月4日

准备考试加上元旦休息了一阵，修改了围棋相关类的结构；mcts大体上实现。

2017年12月24日

基本上完成了mcts相关类的结构设计。

2017年12月23日

AlphaGo Zero的model写完了！忙网络的实验忙了一下午也没做完，做这个调节一下心情。

2017年12月22日

对model类注释完毕，并针对此项目进行了部分修改，主要是参数部分。

2017年12月21日

完善了围棋相关类，增加了结算子目和判断真眼的功能；对围棋类增加了针对AlphaGo Zero输入的格式化；对model类增加了注释。

2017年12月19日

花了一个下午，完成PlayGo和ShowGo的编写，即对围棋规则类编写完成，并提供最简单的可视化，其后依据后续需要完善其功能。

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].

Cheap and reliable Node.js hosting starts at $3/month, and $1/month static HTML hosting

KelvinKarRoy / KKAlphaGoZero

Programming Languages

Labels

Projects that are alternatives of or similar to KKAlphaGoZero

KKAlphaGoZero

项目结构

任务清单

网络结构

参考资料

AlphaGo

MCTS

更新日志

2018年1月14日

2018年1月4日

2017年12月24日

2017年12月23日

2017年12月22日

2017年12月21日

2017年12月19日