python中如何實現資訊增益和資訊增益率
一、資訊增益與資訊增益率
1、資訊增益
以某特徵劃分資料集前後的熵的差值。熵可以表示樣本集合的不確定性,熵越大,樣本的不確定性就越大。因此可以使用劃分前後集合熵的差值來衡量使用當前特徵對於樣本集合D劃分效果的好壞。
資訊增益 = entroy(前) - entroy(後)
注意:資訊增益表示得知特徵X的資訊而使得類Y的資訊熵減少的程度
2、資訊增益率
增益率是用前面的資訊增益Gain(D, a)和屬性a對應的"固有值"(intrinsic value) [Quinlan , 1993J的比值來共同定義的。
二、資訊增益與資訊增益率python程式碼實現
1、資訊增益定義計算資訊增益的函式:計算g(D|A)
def g(data, str1, str2): e1 = data.groupby(str1).apply(lambda x: infor(x[str2])) p1 = pd.value_counts(data[str1]) / len(data[str1]) # 計算Infor(D|A) e2 = sum(e1 * p1) return infor(data[str2]) - e2 print("學歷資訊增益:{}".format(g(data, "學歷", "類別"))) # 輸出結果為:學歷資訊增益:0.08300749985576883
2、資訊增益率定義計算資訊增益率的函式:計算gr(D,A)
def gr(data, str1, str2): return g(data, str1, str2) / infor(data[str1]) print("學歷資訊增益率:", gr(data, "學歷", "類別")) # 輸出結果為:學歷資訊增益率: 0.05237190142858302
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2983/viewspace-2830663/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- [機器學習]資訊&熵&資訊增益機器學習熵
- 分類演算法屬性選擇度量--資訊增益、增益率、Gini指標演算法指標
- 資訊增益(IG)特徵提取例項特徵
- ML-熵、條件熵、資訊增益熵
- 機器學習筆記之資訊熵、資訊增益和決策樹(ID3演算法)機器學習筆記熵演算法
- 基於資訊增益和基尼指數的二叉決策樹
- 決策樹中資訊增益、ID3以及C4.5的實現與總結
- 模擬增益(Analog Gain)、數字增益(Digital Gain)AIGit
- 增益 Gain 分貝 dBAI
- 大模型合成資料機理分析,人大劉勇團隊:資訊增益影響泛化能力大模型
- 如何用python實現郵箱傳送資訊Python
- 組網DIY 製做無線網路增益天線
- 如何實現掃碼填報資訊
- 教你如何運用python實現學生資訊管理系統Python
- CRM系統實現資訊共享如何操作
- Python實現拼多多商品資訊抓取方法Python
- vue實現登入和個人資訊元件展示Vue元件
- 詳解 WebRTC 高音質低延時的背後 — AGC(自動增益控制)WebGC
- 如何在NEO區塊鏈上實現資訊加密區塊鏈加密
- 代理IP如何實現網路資訊保安防護?
- 汙水處理廠如何實現資訊化建設
- 如何實現千萬級優惠文章的優惠資訊同步
- python實現微博個人主頁的資訊爬取Python
- 核聚變發電有希望了?美國或宣佈首次實現核聚變能量增益,輸出大於輸入
- 利用Python實現分析給定文字字串中的字元統計資訊Python字串字元
- python實現機率語言零和博弈Python
- 利用 Python 爬蟲實現快遞物流資訊查詢Python爬蟲
- PostgreSQL改元資訊實現invalidindexSQLIndex
- python中系統資訊模組--psutilPython
- MySQL中如何得到許可權資訊MySql
- 基於Python的滲透測試資訊收集系統的設計和實現Python
- Python實現mp3 ID3v2.3資訊提取Python
- Python爬取股票資訊,並實現視覺化資料Python視覺化
- python實現學生資訊管理系統(從淺到深)Python
- 區塊鏈資訊儲存是如何實現安全儲存區塊鏈
- 製造型企業如何實現車間資訊化生產管理?
- AliAGC 自動增益控制演算法:解決複雜場景下的音量問題GC演算法
- 0066 使用PHP和MySQL實現學生分數資訊管理PHPMySql