什麼是 Multiagent Q Learning - ⎝⎛CodingNote.cc ⎞⎠

什麼是 Multiagent Q Learning

2020 年 4 月 9 日
筆記

multiagent 是指同時有多個 agent 更新 value 和 Q 函數，主要的算法有：q learning， friend and foe q leaning，correlated q learning，在每個訓練步驟，學習器會考慮多個 agent 的聯合 states，actions，reward，來更新 q 值，其中會用到函數 f 選擇價值函數。

下圖是單一 agent 和多個 agent 的對比圖，可以很直觀地看到區別：

Previous post

The Preliminary Contest for ICPC Asia Shanghai 2019 K. Peekaboo

Next post

Codeforces Round 588 (Div. 2) – C. Anadi and Domino