從資訊瓶頸理論一瞥機器學習的“大一統理論”

PaperWeekly發表於2019-01-04

原文網址 : https://www.jiqizhixin.com/articles/2019-01-07-18

序言

所有機器學習的原理，本質上都是對同一段資訊在不同空間內的轉換、過濾、重新表徵，最終解碼出一段可讀資訊。為了讓最終資訊可讀，我們需要給最終輸出的每一個 bit 賦予意義。如果是監督學習，則需要定義一個度量來描述輸出資訊與真實資訊的距離。

列舉常見的傳統機器學習，我們可以發現大多數監督學習都遵循著這一機制。

SVM 使用核心機制重新定義了兩個向量的內積，經過 centering 這樣一個定義原點的操作之後，可以很快看出核心機制實際上重新定義了兩個樣本間的歐式距離。

而任意兩點間的歐式距離被改變，則意味著座標系的轉換，並且轉換過後的新座標系基本上不再是直角座標系了，很可能是一個更高或是更低維度流型上的曲線座標系。這時優化度量 margin loss 再在新座標系上嘗試分割出正負樣本的 support vector 的最大間隔，找到線性超平面即可。

所有迴歸，包括線性迴歸、迴歸樹，以及各種 boosting tree，其座標轉換部分也非常明顯，從 N 維輸入到 1 維輸出的轉換（不管線性還是非線性），之後接一個優化度量（KL 距離既交叉熵、最小二乘、triplet loss，etc.）。

貝葉斯流派的最終優化目標：logP(x)，其本質還是減少從資訊瓶頸理論一瞥機器學習的“大一統理論” ，即增加預測分佈與目標分佈的互資訊。其特徵空間的轉換的方法，就比較五花八門了，這裡不細分析。

那麼，除了輸入與輸出的表徵方法，以及優化度量的選擇之外，是否在各種機器學習包括深度學習方法內，通用的一些規則呢？就如同牛頓三大定律一樣，足以解釋所有經典力學的公式。

從資訊瓶頸方法出發，接下來會嘗試解釋一系列深度學習中出現的知識，並稍作延伸與傳統學習的知識點進行類比，去探索機器學習的最核心思路。

資訊理論理論學習筆記
2019-02-22
筆記
資訊理論-Turbo碼學習
2020-11-19
【機器學習】Logistic Regression 的前世今生（理論篇）
2019-02-22
機器學習
機器學習-學習率：從理論到實戰，探索學習率的調整策略
2023-12-05
機器學習
機器學習入門(二) — 迴歸模型 (理論)
2018-12-07
機器學習模型
決策樹在機器學習的理論學習與實踐
2018-03-29
機器學習
深度學習-第三章機率與資訊理論
2022-12-01
深度學習
聊聊 AI 學習入門 - 數學和資訊理論
2024-07-19
AI
分散式理論學習
2024-03-14
分散式
當博弈論遇上機器學習：一文讀懂相關理論
2019-10-28
機器學習
機器學習系列文章：貝葉斯決策理論
2018-09-22
機器學習
快照隔離的理論學習
2020-08-31
從2019 AI頂會最佳論文，看深度學習的理論基礎
2020-01-27
AI深度學習
2018自然語言處理與機器學習論文發表統計
2019-01-12
自然語言處理機器學習
深度學習相關理論
2024-05-05
深度學習
從變分編碼、資訊瓶頸到正態分佈：論遺忘的重要性
2024-07-08
資訊理論入門教程
2019-08-01
機器學習基礎篇：支援向量機（SVM）理論與實踐
2021-08-20
機器學習
鑑權理論知識學習
2024-08-07
統計學理論—方差分析
2020-11-10
深度學習-理論學習關鍵示意圖
2020-10-03
深度學習
機器學習入門學習筆記：（2.1）線性迴歸理論推導
2019-02-15
機器學習筆記
機器學習緒論
2023-02-02
機器學習
機器人系統的方程求解（現代控制理論2）
2020-10-16
機器人
分散式理論(二) - BASE理論
2018-06-17
分散式
理論
2024-10-23
從資訊理論的角度理解與視覺化神經網路
2018-04-11
視覺化神經網路
關於“學習金字塔理論”的所思所想
2018-08-17
李巨集毅GAN學習（四）GAN的基本理論
2018-12-27
分散式系統的 CAP 理論
2020-04-06
分散式
Oracle效能優化方法論的發展之四：基於資源瓶頸分析的優化方法論
2018-10-12
Oracle優化
4篇論文入選資料庫頂會，騰訊雲突破資料庫效能瓶頸
2024-08-29
資料庫
緒論初識機器學習
2018-12-13
機器學習
DevOps 從理論到實踐指南
2019-10-29
dev
從理論去分析一張圖
2020-09-21
衰老理論
2019-01-09
CAP理論
2021-05-06
DDD理論學習系列（3）-- 限界上下文
2021-09-09

從資訊瓶頸理論一瞥機器學習的“大一統理論”

序言

相關文章