什麼是 Multiagent Q Learning
- 2020 年 4 月 9 日
- 筆記
multiagent 是指同時有多個 agent 更新 value 和 Q 函數,主要的算法有:q learning, friend and foe q leaning,correlated q learning,在每個訓練步驟,學習器會考慮多個 agent 的聯合 states,actions,reward,來更新 q 值,其中會用到函數 f 選擇價值函數。
下圖是單一 agent 和 多個 agent 的對比圖,可以很直觀地看到區別:
