Releases: kobanium/TamaGo
v0.11.0
以下の改良を行いました。
- 非同期並列自己対戦の実装 (#114)
本改良により、下記環境・設定下で1日80万局の強化学習ができることを確認しています。
- CPU : Intel Core i9-10850K
- GPU : NVIDIA Geforce RTX 3090
- 自己対戦時の探索回数 : 1手16回
- ニューラルネットワークのフィルタ数 : 64
- ニューラルネットワークのブロック数 : 6
モデルファイルはv0.8.0リリースから取得できます。
Support a following feature.
- Asynchronous parallel self-play for reinforcement learning (#114)
As a result of this improvement, I have confirmed that self-play for reinforcement learning can achieve 800,000 games per day under the following environment and settings:
- CPU : Intel Core i9-10850K
- GPU : NVIDIA Geforce RTX 3090
- The number of visits for self-play : 16
- The number of filters for a neural network : 64
- The number of blocks for a neural network : 6
Please download neural network model files from v0.8.0 release.
v0.10.0
以下の改良を行いました。
- 探索結果の可視化機能の追加 (#94)
- 探索回数(visits)の厳密指定 (#95)
- SGF文字列を直接読み込むtamago-readsgfコマンドの追加 (#97)
- 探索木が一杯になったときの自動拡張 (#109)
以下のバグを修正しました。
- loadsgfコマンドの綴り誤りの修正 (#98)
Support following features.
- Search tree visualization (#94)
- Strict visits count option (#95)
- tamago-readsgf command (#97)
- Re-allocate tree when tree is full (#109)
Fix following bug.
- misspelling loadsgf command (#98)
v0.9.2
v0.9.1
v0.9.0
以下の改良を行いました。
以下のバグを修正しました。
- 不正なGTPコマンド入力時の応答不正 #82
モデルファイルはv0.8.0リリースから取得できます。
LizGobanを使用する際は0.8.0-pre4以降のバージョンのLizGobanを取得してください。
Support following features.
Fix following bugs.
- Incorrect response when accept unsupport GTP command. #82
Please download neural network model files from v0.8.0 release.
When you use LizGoban, please download LizGoban 0.8.0-pre4 or later.
v0.8.0
以下の改良を行いました。
- SHOTでmixed value approximationを使うように変更 #69
- 持ち時間を与えた時に思考時間を効率的に使うように変更
以下のバグを修正しました。
SHOTの改良に伴い200万局自己対戦を行いrl-model.binを作りなおしました。
Support following features
- Using mixed value approximation for SHOT. #69
- Efficient time management.
Fix following bugs.
- Incorrect calculation of get_num_liberties method. #72
- Zero division when executing cgos-genmove_analyze. #71
Retrained rl-model.bin with 2,000,000 games.
v0.7.1
v0.7.0
以下の機能を実装しました。
- lz-genmove_analyze, lz-analyze等の解析コマンド
- CGOSに読み筋を送るcgos-genmove_analyzeコマンド
- CGOSに接続するための全ての石を打ち上げるまでパスを抑制するオプション (--cgos-modeオプション)
- 探索木を構成するノードの最大数を指定するオプション (--tree-sizeオプション)
また以下のバグを修正しました。
- 超劫判定処理が正常に動作しない
- 強化学習時のWindow Sizeの集計処理の誤り
- 強化学習のImproved Policyの読み込みに先頭の値が無視される
Support following features,
- Analysis commands (lz-genmove_analyze, lz-analyze).
- Analysis commands for Computer Go Server (cgos-genmove_analyze).
- Command line option for CGOS player (--cgos-mode option).
- Command line option for maximum number of nodes for MCTS (--tree-size option).
Fixi following bugs,
- Super ko checking function.
- Miscounting the number of files for window size of reinforcement learning.
- Missing first value of improved policy, reading from SGF files.
v0.6.5
思考時間の管理を探索回数だけでなく消費時間でも行うようにしました。
また下記のバグを修正しました
- 強化学習実行時の--window-sizeオプションのファイル数数え上げ処理
- GPU使用時にGoGUI解析コマンドが落ちる
Thinking time is now managed not only by the number of visits, but also by the time spent.
The following bugs have also been fixed,
- Counting the number of files for the --window-size option for reinforcement learning.
- GoGUI analysis commands fail when using GPU