Google Research Football (scenario 11) 實驗
- 2019 年 10 月 7 日
- 筆記
在之前的公眾號文章中我們介紹了Football Academy中的兩個scenario的實驗:
Google Research Football (scenario 2) 實驗
Google Research Football (scenario 7) 實驗
這裡分享的是Football Academy中最後一個 scenario 的一些實驗結果。

scenario 2 和 scenario 7 都不是完整比賽,遊戲複雜度相對較低,scenario 11 是 11v11 比賽,更像完整比賽,但是被搶斷,出界,進球都會終止比賽。
Google Research Football 最近升級到1.5版本,但是跑的時候遇到了顯示的bug,變成了黑白風格。。
已經在官方github項目提交 issue,還在解決中。
https://github.com/google-research/football/issues/64
1. 通過簡單的傳球和帶球,到禁區附近伺機射門,得分可達0.95。
2. 我們正在進行11v11的正式比賽訓練,用訓練過的agent也可以跑scenario 11,但是不會刻意避免終止的情況,所以得分不高。
3. 隨機 scenario 11 進球集錦

官方的Baseline里的PPO算法訓練得分為0.7,IMPALA訓練100M的得分為0.4, 我們訓練得分為0.95。
訓練算法和代碼可以在我們的強化學習項目中找到,普通版本和並行版本鏈接: https://github.com/createamind/DRL
https://github.com/createamind/Distributed-DRL 歡迎加入或支持我們 :)