強化學習五大方面-環境

萬一啊發表於2021-01-21

原文網址 : https://www.cnblogs.com/yblBlog/p/14309827.html

強化學習

前言

接下來會對環境進行闡述，該文章內容和較少，但為保證系列文章完整性因此考慮獨立寫出來。

環境的概述

在前面的文章中提到，環境是代理玩耍的場所，代理做出動作作用於環境，環境會像一個老師對代理所做的動作打分（獎勵Reward），同時代理可以觀察環境得到狀態，也叫觀察。

環境分類

環境主要有兩大類，物理環境和模擬環境

物理環境

物理環境即為真實環境，我們實際生活的環境，例如要訓練一個機器人自主行走，我們可以將機器人仍在地面，在真實環境中訓練機器人。這樣的好處很明顯，因為沒有什麼比真實還要真實，這樣子訓練的機器人更加適應真實環境，但缺點也很明顯，首先會損壞硬體裝置，最初的機器人就是白痴，任何動作均會讓機器人摔倒，所以會使得機器人損壞，第二是訓練時間很長且不便於訓練，機器人在前期的訓練會不斷摔倒，因此需要認為將其扶正，極度不變與浪費時間。因此便有了模擬環境。

模擬環境

模擬環境便是根據現實環境進行抽象建模，仿照一個虛擬環境。好處是避免了物理硬體的損壞，同時也使得訓練速度加快，是最常用的方法。

強化學習五大方面-獎勵與策略結構
2021-01-22
強化學習
強化學習實戰 | 自定義Gym環境
2021-12-05
強化學習
【記錄】強化學習環境legged_gym配置
2024-07-14
強化學習
強化學習實戰 | 自定義Gym環境之掃雷
2022-01-26
強化學習
強化學習實戰 | 自定義Gym環境之井字棋
2021-12-06
強化學習
強化學習實戰 | 自定義gym環境之顯示字串
2022-01-08
強化學習字串
MindSpore強化學習：使用PPO配合環境HalfCheetah-v2進行訓練
2024-04-29
強化學習
(一)Linux環境的學習環境的搭建
2022-07-03
Linux
Linux學習環境搭建
2020-07-23
Linux
深度學習環境配置
2024-10-08
深度學習
強化學習
2020-12-05
強化學習
強化學習-學習筆記13 | 多智慧體強化學習
2022-07-10
強化學習筆記智慧體
DeepMind開源強化學習環境，場景靈活介面簡單，推特高贊
2019-08-20
強化學習
【強化學習篇】--強化學習案例詳解一
2018-06-30
強化學習
【強化學習】強化學習術語表（A-Z）
2020-10-25
強化學習
深度強化學習day01初探強化學習
2019-06-27
強化學習
Windows搭建Superset環境學習
2020-08-05
Windows
搭建verilog/systemverilog學習環境
2024-06-08
Kubernetes學習---環境搭建篇
2021-11-08
如何分分鐘構建強大又好用的深度學習環境？
2019-03-17
深度學習
強化學習10——迭代學習
2020-10-26
強化學習
matplotlib 強化學習
2020-06-21
強化學習
【強化學習篇】--強化學習從初識到應用
2018-06-30
強化學習
webpack學習筆記(mac環境）
2018-05-16
Web筆記Mac
Ubuntu 18.04 深度學習環境搭建
2018-05-17
Ubuntu深度學習
學習使用azureCLI建立linux環境
2018-03-14
Linux
學習筆記：MQTT環境搭建
2020-11-18
筆記MQQT
深度學習環境配置（windows 11）
2024-09-05
深度學習Windows
【Ansible】ansible容器學習環境搭建
2022-03-27
Android環境搭建學習筆記
2020-12-12
Android筆記
基於化學環境的多相催化吸附機器學習框架
2022-10-11
機器學習框架
【機器學習】深度學習開發環境搭建
2018-11-26
機器學習深度學習開發環境
乾貨｜個性化推薦系統五大研究熱點之強化學習（三）
2019-01-09
強化學習
強化學習-學習筆記3 | 策略學習
2022-07-05
強化學習筆記
再探強化學習
2024-03-14
強化學習
強化學習分類
2024-08-12
強化學習
強化學習筆記
2023-04-07
強化學習筆記
強化學習之CartPole
2021-06-14
強化學習

強化學習五大方面-環境

前言

環境的概述

環境分類

物理環境

模擬環境

導航

相關文章