強化學習10——迭代學習
一、基本概念
迭代學習控制(Iterative Learning Control,ILC)的思想最初由日本學者Uchiyama於1978年提出,於1984年由Arimoto等人做出了開創性的研究。這些學者借鑑人們在重複過程中追求滿意指標達到期望行為的簡單原理,成功地使具有強耦合非線性多變數的工業機器人快速高精度地執行軌跡跟蹤任務。其基本做法是:對於一個在有限時間區間內執行軌跡跟蹤任務的機器人,利用前一次或前幾次操作時測得的誤差資訊修正控制輸入,使得該重複任務在下一次操作過程中做得更好。如此不斷重複,直至在整個時間區間內輸出軌跡跟蹤期望軌跡。
迭代學習控制適合於具有重複運動性質的被控物件,通過迭代修正達到某種控制目標的改善。迭代學習控制方法不依賴於系統的精確數學模型,能在給定的時間範圍內,以非常簡單的演算法實現不確定性較高的非線性強耦合動態系統的控制,並高精度跟蹤給定期望軌跡,因而一經推出,就在運動控制領域得到了廣泛的運用。
二、基本原理
迭代學習控制可分為開環學習和閉環學習。
開環學習控制的方法是:第k+1次的控制等於第k次控制再加上第k次輸出誤差的校正項,即
閉環學習策略是:取第k+1次執行的誤差作為學習的修正項,即
式中,L為線性或非線性運算元
相關文章
- 強化學習理論-第4課-值迭代與策略迭代強化學習
- 強化學習-學習筆記10 | 經驗回放強化學習筆記
- 強化學習-學習筆記13 | 多智慧體強化學習強化學習筆記智慧體
- 強化學習強化學習
- 強化學習-學習筆記3 | 策略學習強化學習筆記
- 【強化學習篇】--強化學習案例詳解一強化學習
- 【強化學習】強化學習術語表(A-Z)強化學習
- 深度強化學習day01初探強化學習強化學習
- 強化學習-學習筆記2 | 價值學習強化學習筆記
- 深度學習+深度強化學習+遷移學習【研修】深度學習強化學習遷移學習
- matplotlib 強化學習強化學習
- 強化學習-學習筆記5 | AlphaGo強化學習筆記Go
- 深度學習及深度強化學習研修深度學習強化學習
- 【強化學習篇】--強化學習從初識到應用強化學習
- 強化學習-學習筆記12 | Dueling Network強化學習筆記
- 深度學習及深度強化學習應用深度學習強化學習
- 關於強化學習、深度學習deeplearning研修強化學習深度學習
- 再探強化學習強化學習
- 強化學習分類強化學習
- 強化學習筆記強化學習筆記
- 強化學習之CartPole強化學習
- 強化學習-簡介強化學習
- 【強化學習】強化學習的基本概念與程式碼實現強化學習
- 強化學習-學習筆記15 | 連續控制強化學習筆記
- 強化學習-學習筆記8 | Q-learning強化學習筆記
- 強化學習-學習筆記1 | 基礎概念強化學習筆記
- 強化學習-學習筆記4 | Actor-Critic強化學習筆記
- 深度學習、強化學習核心技術實戰深度學習強化學習
- 機器學習、深度學習、強化學習課程超級大列表!機器學習深度學習強化學習
- 強化學習-task01強化學習
- 強化學習入門 -KDnuggets強化學習
- Python學習迭代器(Iterator)Python
- 強化學習(十七) 基於模型的強化學習與Dyna演算法框架強化學習模型演算法框架
- 強化學習入門之智慧走迷宮-策略迭代演算法強化學習演算法
- 強化學習-學習筆記9 | Multi-Step-TD-Target強化學習筆記
- 強化學習-學習筆記11 | 解決高估問題強化學習筆記
- 強化學習-學習筆記14 | 策略梯度中的 Baseline強化學習筆記梯度
- 強化學習(十一) Prioritized Replay DQN強化學習Zed