python中如何實現資訊增益和資訊增益率
一、資訊增益與資訊增益率
1、資訊增益
以某特徵劃分資料集前後的熵的差值。熵可以表示樣本集合的不確定性,熵越大,樣本的不確定性就越大。因此可以使用劃分前後集合熵的差值來衡量使用當前特徵對於樣本集合D劃分效果的好壞。
資訊增益 = entroy(前) - entroy(後)
注意:資訊增益表示得知特徵X的資訊而使得類Y的資訊熵減少的程度
2、資訊增益率
增益率是用前面的資訊增益Gain(D, a)和屬性a對應的"固有值"(intrinsic value) [Quinlan , 1993J的比值來共同定義的。
二、資訊增益與資訊增益率python程式碼實現
1、資訊增益定義計算資訊增益的函式:計算g(D|A)
def g(data, str1, str2): e1 = data.groupby(str1).apply(lambda x: infor(x[str2])) p1 = pd.value_counts(data[str1]) / len(data[str1]) # 計算Infor(D|A) e2 = sum(e1 * p1) return infor(data[str2]) - e2 print("學歷資訊增益:{}".format(g(data, "學歷", "類別"))) # 輸出結果為:學歷資訊增益:0.08300749985576883
2、資訊增益率定義計算資訊增益率的函式:計算gr(D,A)
def gr(data, str1, str2): return g(data, str1, str2) / infor(data[str1]) print("學歷資訊增益率:", gr(data, "學歷", "類別")) # 輸出結果為:學歷資訊增益率: 0.05237190142858302
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2983/viewspace-2830663/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資訊增益
- ML-熵、條件熵、資訊增益熵
- 決策樹中資訊增益、ID3以及C4.5的實現與總結
- 基於資訊增益的ID3決策樹介紹。
- 基於資訊增益和基尼指數的二叉決策樹
- 模擬增益(Analog Gain)、數字增益(Digital Gain)AIGit
- 大模型合成資料機理分析,人大劉勇團隊:資訊增益影響泛化能力大模型
- 如何用python實現郵箱傳送資訊Python
- 如何實現掃碼填報資訊
- 教你如何運用python實現學生資訊管理系統Python
- Python實現拼多多商品資訊抓取方法Python
- 音訊資料增強及python實現音訊Python
- CRM系統實現資訊共享如何操作
- Python爬取股票資訊,並實現視覺化資料Python視覺化
- python多執行緒中訊息佇列如何實現?Python執行緒佇列
- PostgreSQL改元資訊實現invalidindexSQLIndex
- 【統計資訊】如何備份和還原統計資訊
- 利用Python實現分析給定文字字串中的字元統計資訊Python字串字元
- 利用 Python 爬蟲實現快遞物流資訊查詢Python爬蟲
- python實現微博個人主頁的資訊爬取Python
- vue實現登入和個人資訊元件展示Vue元件
- 代理IP如何實現網路資訊保安防護?
- 汙水處理廠如何實現資訊化建設
- 教你如何實現頁面間的資料通訊
- 如何在NEO區塊鏈上實現資訊加密區塊鏈加密
- 工業相機曝光和增益的一些基本概念
- ajax編輯資訊和刪除資訊
- Python實現mp3 ID3v2.3資訊提取Python
- python實現學生資訊管理系統(從淺到深)Python
- 0066 使用PHP和MySQL實現學生分數資訊管理PHPMySql
- 基於Python的滲透測試資訊收集系統的設計和實現Python
- 教你如何用Python追蹤快遞資訊!Python
- 以資訊科技推動建築工程行業實現資訊化管理行業
- uniapp 實現個人資訊的修改APP
- 網站公司資訊修改,如何在網站中輕鬆修改公司資訊網站
- 如何實現千萬級優惠文章的優惠資訊同步
- 如何實現臺達PLC與上位機的資料通訊?
- 區塊鏈資訊儲存是如何實現安全儲存區塊鏈