在PPO演算法中,使用softmax函式使actor網路生成離散動作與其對應的機率分佈時,碰到了出現[1,0,0]這種情況。
經過查驗,是因為狀態空間s的輸入數值太大,經驗證,超過500即會產生這種情況,具體什麼原因不得而知。(待查證)
解決方案就是將狀態空間歸一化,縮小之後就好了。
PPO演算法動作機率出現[0,0,0,0,0,1]的問題
相關文章
- Java 控制隨機數出現的機率Java隨機
- gulimall出現的問題
- 虛擬主機使用中可能出現的問題
- 使用finalshell出現的問題
- 開機出現故障的15段英文所代表的問題
- Redis作為快取可能會出現的問題及解決方案Redis快取
- Java操作hdfs出現的問題Java
- npm install 時出現的問題NPM
- nginx 編譯出現的問題Nginx編譯
- mysql 安裝出現的問題MySql
- win10開機提示啟動LenovoBatteryGaugepackage.dll時出現問題的解決方法Win10BATPackage
- 一些比較典型的機率期望問題
- SOLIDWORKS啟動時出現指令碼錯誤問題Solid指令碼
- 伺服器啟動出現問題如何處理伺服器
- 專案出現的問題記錄
- springboot對接mqtt出現的問題Spring BootMQQT
- dubbo繼承springboot出現的問題繼承Spring Boot
- 【Azure Redis】部署在AKS中的應用,連線Redis高頻率出現timeout問題Redis
- 解決Charles手機抓包出現unknown和亂碼的問題
- Struts2中Action動態呼叫DMI出現的一個問題
- Nuxt升級2.0.0時出現的問題UX
- Xcode斷點除錯出現的問題XCode斷點除錯
- AD9中出現的問題
- 解決Ubuntu配置nginx出現的問題UbuntuNginx
- ubuntu出現迴圈登入的問題Ubuntu
- SSM專案出現的依賴問題SSM
- 如何快速定位線上出現的問題?
- Cookie出現兩個同名Key的問題Cookie
- 啟動/刪除Docker容器時出現問題 - 如何修復Docker
- 多機器人協作排程問題機器人
- servlet 呼叫jdbc 出現得問題ServletJDBC
- C語言基礎例項—3句解決數字出現頻率問題C語言
- 瞭解機率知識,機率作為機器學習的底層邏輯機器學習
- [20220531]驗證inactive session出現的問題.txtSession
- 遇到一個建表時出現的問題
- 單例模式中的DDCP可能出現的問題單例模式
- JAVA訪問雲資料mysql出現問題JavaMySql
- MAC電腦出現問題,無法正常啟動怎麼辦?Mac