今日面試題分享:什麼是最大熵
什麼是最大熵?
參考答案:
解析:
熵是隨機變數不確定性的度量,不確定性越大,熵值越大;若隨機變數退化成定值,熵為0。如果沒有外界干擾,隨機變數總是趨向於無序,在經過足夠時間的穩定演化,它應該能夠達到的最大程度的熵。
為了準確的估計隨機變數的狀態,我們一般習慣性最大化熵,認為在所有可能的概率模型(分佈)的集合中,熵最大的模型是最好的模型。換言之,在已知部分知識的前提下,關於未知分佈最合理的推斷就是符合已知知識最不確定或最隨機的推斷,其原則是承認已知事物(知識),且對未知事物不做任何假設,沒有任何偏見。
例如,投擲一個骰子,如果問"每個面朝上的概率分別是多少",你會說是等概率,即各點出現的概率均為1/6。因為對這個"一無所知"的色子,什麼都不確定,而假定它每一個朝上概率均等則是最合理的做法。從投資的角度來看,這是風險最小的做法,而從資訊理論的角度講,就是保留了最大的不確定性,也就是說讓熵達到最大。
3.1 無偏原則
下面再舉個大多數有關最大熵模型的文章中都喜歡舉的一個例子。
例如,一篇文章中出現了“學習”這個詞,那這個詞是主語、謂語、還是賓語呢?換言之,已知“學習”可能是動詞,也可能是名詞,故“學習”可以被標為主語、謂語、賓語、定語等等。
令x1表示“學習”被標為名詞, x2表示“學習”被標為動詞。
令y1表示“學習”被標為主語, y2表示被標為謂語, y3表示賓語, y4表示定語。
且這些概率值加起來的和必為1,即 ,
, 則根據無偏原則,認為這個分佈中取各個值的概率是相等的,故得到:
因為沒有任何的先驗知識,所以這種判斷是合理的。如果有了一定的先驗知識呢? 即進一步,若已知:“學習”被標為定語的可能性很小,只有0.05,即
,剩下的依然根據無偏原則,可得:
再進一步,當“學習”被標作名詞x1的時候,它被標作謂語y2的概率為0.95,即
,此時仍然需要堅持無偏見原則,使得概率分佈儘量平均。但怎麼樣才能得到儘量無偏見的分佈?
實踐經驗和理論計算都告訴我們,在完全無約束狀態下,均勻分佈等價於熵最大(有約束的情況下,不一定是概率相等的均勻分佈。 比如,給定均值和方差,熵最大的分佈就變成了正態分佈 )。
於是,問題便轉化為了:計算X和Y的分佈,使得H(Y|X)達到最大值,並且滿足下述條件:
因此,也就引出了最大熵模型的本質,它要解決的問題就是已知X,計算Y的概率,且儘可能讓Y的概率最大(實踐中,X可能是某單詞的上下文資訊,Y是該單詞翻譯成me,I,us、we的各自概率),從而根據已有資訊,儘可能最準確的推測未知資訊,這就是最大熵模型所要解決的問題。
相當於已知X,計算Y的最大可能的概率,轉換成公式,便是要最大化下述式子H(Y|X):
且滿足以下4個約束條件:
題目來源:七月線上官網(www.julyedu.com)——面試題庫——面試大題——機器學習
今日學習推薦
【機器學習集訓營第八期】
火熱報名中
前三十人特惠價:14199
2019年4月15日開課
報名加送18VIP[包2018全年線上課程和全年GPU]
且兩人及兩人以上組團還能各減500元
有意的親們抓緊時間嘍
諮詢/報名/組團可新增微信客服
julyedukefu_02
掃描下方二維碼
免費試聽
☟
長按識別二維碼
助力“金三銀四”
分享一套全體系人工智慧學習資料
600G資料 限時限額0元領
小夥伴們可以屯起來,慢慢學習喔~
掃描下方海報二維碼
立即領取
☟
▼往期推薦▼
神經網路P圖新神器:摘墨鏡戴美瞳都能搞定,加首飾換髮型真假難分 | 程式碼開源
一文詳解機器學習中最好用的提升方法:Boosting 與 AdaBoost
點
諮詢,檢視課程,請點選“閱讀原文”
給我【好看】
你也越好看!
相關文章
- 今日面試題分享:解決bias和Variance問題的方法是什麼?面試題
- 今日面試題分享面試題
- 今日面試題分享:為什麼xgboost要用泰勒展開,優勢在哪裡?面試題
- 今日面試題分享:請問(決策樹、Random Forest、Booting、Adaboot)GBDT和XGBoost的區別是什麼?...面試題randomRESTboot
- 最大熵模型熵模型
- 熵、聯和熵與條件熵、交叉熵與相對熵是什麼呢?詳細解讀這裡有!熵
- 面試題1:9月25日面試題面試題
- 今日面試雪崩面試
- Nginx 常用面試題-什麼是NginxNginx面試題
- 今日面試總結面試
- 軟體測試培訓分享:效能測試的目的是什麼
- 今日面試題分享:如何理解模型的過擬合與欠擬合,以及如何解決?面試題模型
- 【Linux分享】什麼是CDN?CDN加速的原理是什麼?Linux
- 【Java面試】什麼是可重入,什麼是可重入鎖? 它用來解決什麼問題?Java面試
- AI筆試面試題庫-什麼是區塊鏈?AI筆試面試題區塊鏈
- 面試題:談談什麼是Zab協議?面試題協議
- 敏捷測試是什麼?敏捷測試
- 什麼是MIPI測試?
- 最大熵模型詳解與Python實現熵模型Python
- 什麼是滲透測試?與安全測試的區別是什麼?
- 阿里失敗的最大原因是什麼?阿里
- 推行精益生產的最大阻力是什麼
- Web前端技術分享:什麼是塊元素?什麼是行內元素?Web前端
- 記十月十五日面試面試
- 你演講(分享)是為了什麼?
- 什麼是冒煙測試?
- 面試每日一題008:什麼是遊戲文案?包含什麼內容?(文案向)面試每日一題遊戲
- 今日面試題分享:請寫出你瞭解的機器學習特徵工程操作,以及它的意義面試題機器學習特徵工程
- 2020小遊戲賽道最大變數是什麼?遊戲變數
- 【知識分享】伺服器cdn是什麼有什麼功能伺服器
- 【知識分享】代理伺服器是什麼有什麼用伺服器
- 【知識分享】asp伺服器是什麼有什麼用途伺服器
- 什麼是滲透測試?為什麼要做滲透測試?
- 1.2什麼是軟體測試?目的又是什麼?
- 面試官:Dubbo是什麼,他有什麼特性?面試
- 8.2 什麼是事件主題事件
- 什麼是測試左移和測試右移
- 當今遊戲行業最缺什麼人才?遊戲行業