MADQN：多代理合作強化學習

deephub發表於2024-03-14

原文網址 : https://www.cnblogs.com/deephub/p/18072498

處理單一任務是強化學習的基礎，它的目標是在不確定的環境中採取最佳行動，產生相對於任務的最大長期回報。但是在多代理強化學習中，因為存在多個代理，所以代理之間的關係可以是合作的，也可以是對抗，或者兩者的混合。多代理的強化學習引入了更多的複雜性，每個代理的狀態不僅包括對自身的觀察，還包括對其他代理位置及其活動的觀察。

在訓練對抗的多代理模型時，目標一般是讓所有競爭的代理透過達到一種稱為納什均衡的博弈狀態來發現對抗對手的最佳策略。所以對抗性多代理強化學習可以適應和建模現實世界的問題，如公司間或國家間的經濟競爭。

而對於協作式多代理學習，其目標是讓多個代理朝著某個目標進行協作。這可能涉及到代理之間的“溝通”，例如學習如何在實現長期目標的協作中專注於完成特定的子任務。協作式多代理強化學習可以應用於現實環境，例如在倉庫操作中操作一隊機器人，甚至是一輛自動駕駛計程車。

在本文中我們將只關注合作多代理學習的問題，不僅因為它在我們日常生活中更常見，而對於我們學習來說也相對的簡單一些。

https://avoid.overfit.cn/post/25b88a2b4a3c447faad6cd169dc9c2c5

強化學習-學習筆記13 | 多智慧體強化學習
2022-07-10
強化學習筆記智慧體
強化學習
2020-12-05
強化學習
【強化學習篇】--強化學習案例詳解一
2018-06-30
強化學習
【強化學習】強化學習術語表（A-Z）
2020-10-25
強化學習
深度強化學習day01初探強化學習
2019-06-27
強化學習
強化學習10——迭代學習
2020-10-26
強化學習
matplotlib 強化學習
2020-06-21
強化學習
【強化學習篇】--強化學習從初識到應用
2018-06-30
強化學習
ICLR 2020 多智慧體強化學習論文總結
2020-09-29
ICLR智慧體強化學習
強化學習-學習筆記3 | 策略學習
2022-07-05
強化學習筆記
再探強化學習
2024-03-14
強化學習
強化學習分類
2024-08-12
強化學習
強化學習筆記
2023-04-07
強化學習筆記
強化學習之CartPole
2021-06-14
強化學習
強化學習-簡介
2021-01-20
強化學習
【強化學習】強化學習的基本概念與程式碼實現
2018-03-21
強化學習
強化學習-學習筆記5 | AlphaGo
2022-07-06
強化學習筆記Go
深度學習及深度強化學習研修
2021-01-04
深度學習強化學習
強化學習-學習筆記2 | 價值學習
2022-07-04
強化學習筆記
深度學習+深度強化學習+遷移學習【研修】
2021-03-25
深度學習強化學習遷移學習
強化學習-學習筆記12 | Dueling Network
2022-07-09
強化學習筆記
深度學習及深度強化學習應用
2021-01-04
深度學習強化學習
關於強化學習、深度學習deeplearning研修
2020-11-25
強化學習深度學習
強化學習-task01
2020-10-20
強化學習
強化學習入門 -KDnuggets
2021-04-28
強化學習
北大領銜，多智慧體強化學習研究登上Nature子刊
2024-09-05
智慧體強化學習
強化學習(十七) 基於模型的強化學習與Dyna演算法框架
2019-02-15
強化學習模型演算法框架
強化學習-學習筆記15 | 連續控制
2022-07-14
強化學習筆記
強化學習-學習筆記8 | Q-learning
2022-07-07
強化學習筆記
強化學習-學習筆記10 | 經驗回放
2022-07-08
強化學習筆記
強化學習-學習筆記1 | 基礎概念
2022-07-04
強化學習筆記
強化學習-學習筆記4 | Actor-Critic
2022-07-05
強化學習筆記
深度學習、強化學習核心技術實戰
2021-03-21
深度學習強化學習
強化學習(十一) Prioritized Replay DQN
2018-10-16
強化學習Zed
強化學習(十四) Actor-Critic
2019-01-15
強化學習
強化學習（十）Double DQN (DDQN)
2018-10-12
強化學習
《深度強化學習》手稿開放了！
2018-10-17
強化學習
強化學習的基礎缺陷
2018-07-28
強化學習

MADQN：多代理合作強化學習

https://avoid.overfit.cn/post/25b88a2b4a3c447faad6cd169dc9c2c5

相關文章