強化學習理論-第1課-基礎概念

penuel發表於2024-11-05

1. state:狀態,可以是機器人的位置,速度,加速度等

2. action:對於每一個狀態,可能的動作

3. state transition:狀態轉移

3.1 state transition probability:

4. policy:告訴agent在這個狀態應該採用哪個action

相關文章