關於One-hot編碼
關於One-Hot編碼(獨熱編碼)
在機器學習的應用任務中,對於非連續的資料經常也會使用數字進行編碼,便於處理。例如“男性”編碼為1,“女性”編碼為2。但是這二者之間是不存在數學上的連續關係的,然而如果按照上述1和2進行編碼的話,機器學習演算法會認為“男性”和“女性”之間存在數學的有序關係。
獨熱編碼即One-Hot編碼,又稱一位有效編碼,其方法是使用N位狀態暫存器來對N個狀態進行編碼,每個狀態都由他獨立的暫存器位,並且在任意時候,其中只有一位有效。例如上文中說的“男性”和“女性”共有兩種狀態,那麼就可以編碼為01和10,對於有N個狀態的特徵,經過one-hot編碼後就會變成N個二元值,而其中只有一個為1。(一串字元只有一個位為1)
總結:可以說一種特徵裡面有多少屬性(多少種取值)這個二進位制就有多少位,當這個個體表現有某個屬性的時候就將該屬性對於的位置為1!
採用one-hot編碼的好處主要有:
解決了分類器不好處理屬性資料的問題
在一定程度上也起到了擴充特徵的作用
相關文章
- one-hot編碼
- 文字單詞one-hot編碼
- 資料預處理之獨熱編碼(One-Hot)
- PyTorch之對類別張量進行one-hot編碼PyTorch
- Python實現類別變數的獨熱編碼(One-hot Encoding)Python變數Encoding
- softmax迴歸——原理、one-hot編碼、結構和運算、交叉熵損失熵
- 關於字元編碼你應該知道的事情字元
- 關於Jmeter引數化的編碼問題JMeter
- 關於tomcat在idea上的中文編碼問題TomcatIdea
- 關於加密,解密,摘要,編碼的理解和應用加密解密
- 關於base64編碼的原理及實現
- XML學習筆記(一):關於字元編碼的理解XML筆記字元
- 關於檔案上傳下載的編碼問題
- 關於JDK21控制檯字符集編碼問題JDK
- 關於使用Markdown解析器Parsedown應該注意的編碼...
- 關於密碼密碼
- 關於Objective C編碼規範,這些你一定要會Object
- 關於編譯型語言程式碼優化的一點迷思編譯優化
- 面試關於 MySQL 的編寫面試MySql
- 關於原碼,反碼,補碼
- FSM:One-hot logic equations
- 關於Gdb工具的交叉編譯、移植編譯
- 自編碼器及其相關模型模型
- 關於og4j漏洞修復解決方案及原始碼編譯原始碼編譯
- [Python3] 關於Bytes與String 寫檔案遇到的編碼問題Python
- Simple one-hot state transition 3
- 關於群起kafka指令碼Kafka指令碼
- 關於程式碼複用
- 關於支援OPenACC的編譯器說明編譯
- 面試之Java String 編碼相關面試Java
- Q2:One-hot FSM equations
- 關於FFMPEG的解碼模型模型
- 近期求職關於簡歷編寫的思考求職
- 關於策略組編輯器無法開啟
- 關於本地GB2312編碼的檔案上傳github後 中文出現亂碼的問題Github
- linux下基於官方原始碼編譯ipoptLinux原始碼編譯
- 關於kindeditor插入程式碼問題
- 關於區塊鏈密碼學區塊鏈密碼學