Google Research Football (scenario 11) 实验
- 2019 年 10 月 7 日
- 筆記
在之前的公众号文章中我们介绍了Football Academy中的两个scenario的实验:
Google Research Football (scenario 2) 实验
Google Research Football (scenario 7) 实验
这里分享的是Football Academy中最后一个 scenario 的一些实验结果。

scenario 2 和 scenario 7 都不是完整比赛,游戏复杂度相对较低,scenario 11 是 11v11 比赛,更像完整比赛,但是被抢断,出界,进球都会终止比赛。
Google Research Football 最近升级到1.5版本,但是跑的时候遇到了显示的bug,变成了黑白风格。。
已经在官方github项目提交 issue,还在解决中。
https://github.com/google-research/football/issues/64
1. 通过简单的传球和带球,到禁区附近伺机射门,得分可达0.95。
2. 我们正在进行11v11的正式比赛训练,用训练过的agent也可以跑scenario 11,但是不会刻意避免终止的情况,所以得分不高。
3. 随机 scenario 11 进球集锦

官方的Baseline里的PPO算法训练得分为0.7,IMPALA训练100M的得分为0.4, 我们训练得分为0.95。
训练算法和代码可以在我们的强化学习项目中找到,普通版本和并行版本链接: https://github.com/createamind/DRL
https://github.com/createamind/Distributed-DRL 欢迎加入或支持我们 :)