強化學習分類

penuel發表於2024-08-12

Model-free: Q learning, Sarsa, Policy Gradients
Model-based: 能透過想象來預判斷接下來將要發生的所有情況. 然後選擇這些想象情況中最好的那種

基於機率：Policy Gradients
基於價值：Q learning, Sarsa
兩者融合：Actor-Critic

回合更新：Monte-carlo learning，基礎版的 policy gradients
單步更新：Qlearning, Sarsa, 升級版的 policy gradients

線上學習：sarsa, sarsa lambda
離線學習： Q learning， Deep-Q-Network

相關文章

強化學習
2020-12-05
強化學習
強化學習-學習筆記13 | 多智慧體強化學習
2022-07-10
強化學習筆記智慧體
【強化學習篇】--強化學習案例詳解一
2018-06-30
強化學習
【強化學習】強化學習術語表（A-Z）
2020-10-25
強化學習
深度強化學習day01初探強化學習
2019-06-27
強化學習
伯克利提出時序差分模型TDM：讓深度強化學習更像人類
2018-05-23
模型強化學習
強化學習10——迭代學習
2020-10-26
強化學習
matplotlib 強化學習
2020-06-21
強化學習
【強化學習篇】--強化學習從初識到應用
2018-06-30
強化學習
機器學習--有監督學習--分類演算法（預測分類）
2024-06-18
機器學習演算法
強化學習-學習筆記3 | 策略學習
2022-07-05
強化學習筆記
再探強化學習
2024-03-14
強化學習
強化學習筆記
2023-04-07
強化學習筆記
強化學習之CartPole
2021-06-14
強化學習
強化學習-簡介
2021-01-20
強化學習
強化學習之蒙特卡洛學習,時序差分學習理論與實戰
2020-12-10
強化學習
【強化學習】強化學習的基本概念與程式碼實現
2018-03-21
強化學習
強化學習-學習筆記5 | AlphaGo
2022-07-06
強化學習筆記Go
深度學習及深度強化學習研修
2021-01-04
深度學習強化學習
AAAI 2019 | 基於分層強化學習的關係抽取
2019-03-28
AI強化學習
強化學習-學習筆記2 | 價值學習
2022-07-04
強化學習筆記
深度學習+深度強化學習+遷移學習【研修】
2021-03-25
深度學習強化學習遷移學習
強化學習-學習筆記12 | Dueling Network
2022-07-09
強化學習筆記
深度學習及深度強化學習應用
2021-01-04
深度學習強化學習
關於強化學習、深度學習deeplearning研修
2020-11-25
強化學習深度學習
強化學習-task01
2020-10-20
強化學習
強化學習入門 -KDnuggets
2021-04-28
強化學習
強化學習(十七) 基於模型的強化學習與Dyna演算法框架
2019-02-15
強化學習模型演算法框架
強化學習-學習筆記15 | 連續控制
2022-07-14
強化學習筆記
強化學習-學習筆記8 | Q-learning
2022-07-07
強化學習筆記
強化學習-學習筆記10 | 經驗回放
2022-07-08
強化學習筆記
強化學習-學習筆記1 | 基礎概念
2022-07-04
強化學習筆記
強化學習-學習筆記4 | Actor-Critic
2022-07-05
強化學習筆記
深度學習、強化學習核心技術實戰
2021-03-21
深度學習強化學習
遷移學習時間序列分類
2019-04-08
遷移學習
IO模型學習(一)IO模型分類
2018-04-15
模型
【機器學習】支援向量機分類
2022-07-13
機器學習
深度學習（二）之貓狗分類
2022-03-20
深度學習