號稱能打敗MLP的KAN到底行不行？數學核心原理全面解析

deephub發表於2024-05-08

原文網址 : https://www.cnblogs.com/deephub/p/18179317

前幾天火爆的Kolmogorov-Arnold Networks是具有開創性，目前整個人工智慧社群都只關注一件事LLM。我們很少看到有挑戰人工智慧基本原理的論文了，但這篇論文給了我們新的方向。

mlp或多層感知位於AI架構的最底部，幾乎是每個深度學習架構的一部分。而KAN直接挑戰了這一基礎，並且也挑戰了這些模型的黑箱性質。

也許你看到了很多關於KAN的報告，但是裡面只是簡單的描述性介紹，對於他的執行原理還是不清楚，所以我們這篇文章將涉及大量的數學知識，主要介紹KAN背後的數學原理。

KAN

Kolmogorov-Arnold Networks引入了一種基於Kolmogorov-Arnold表示定理的新型神經網路架構，為傳統的多層感知器(mlp)提供了一種有前途的替代方案。

mlp在節點(“神經元”)上有固定的啟用函式，而kan在邊緣(“權重”)上有可學習的啟用函式。kan根本沒有線性權重，每個權重引數都被引數化為樣條的單變數函式。這個看似簡單的改變使得KANs在準確性和可解釋性方面優於mlp。KANs是mlp的有希望的替代品，為進一步改進當今嚴重依賴mlp的深度學習模型提供了機會。

上面論文的原文，根據論文在資料擬合和PDE求解方面，更小的kan與更大的mlp相當或更好。所以kan可能比mlp擁有更快的神經縮放定律。並且KANs可以直觀地視覺化，大大提高了可解釋性。

論文圍繞函式逼近的Kolmogorov-Arnold表示定理的性質展開，這是這篇論文的全部前提。

表示定理基礎:函式被分解成更簡單的函式，然後使用神經網路進行近似。

平滑性和連續性:目標是確保原始多元函式的平滑性有效地轉化為神經網路近似。

空間填充曲線:函式跨維度的屬性，特別是關注在近似過程中如何保持連續性和其他函式屬性或轉換。

https://avoid.overfit.cn/post/6ee2307e614b462f9c9aac26ef12252d

反轉了？在一場新較量中，號稱替代MLP的KAN只贏一局
2024-07-27
爆火後反轉？「一夜幹掉MLP」的KAN：其實我也是MLP
2024-05-07
替代MLP的KAN，被開源專案擴充套件到卷積了
2024-05-20
套件卷積
Transformer要變Kansformer？用了幾十年的MLP迎來挑戰者KAN
2024-05-03
ORM
全面解析Flutter Platform Channel原理
2019-03-23
FlutterPlatform
binder核心原理解析
2019-02-21
NameServer 核心原理解析
2021-07-12
Server
半路轉行學IT還來得及嗎?0基礎到底行不行？
2020-10-09
從 Oracle 日誌解析學習資料庫核心原理
2022-05-30
Oracle資料庫
前端學習（2578）：Nuxt的核心原理
2020-11-13
前端UX
訊息佇列MQ核心原理全面總結(11大必會原理)
2022-09-22
佇列MQ
VUE全家桶之vuex核心原理解析
2019-03-20
Vue
「進階篇」Vue Router 核心原理解析
2022-04-05
Vue
開源框架TLog核心原理架構解析
2021-03-29
框架架構
卷積神經網路數學原理解析
2022-09-16
卷積神經網路
AI訓練的空洞騎士能打敗大黃蜂小姐姐嗎？
2021-05-25
AI
三七互娛：雲遊戲公司的買量商業模式到底行不行？
2020-11-04
遊戲模式
想要瘦，只吃肉？被推向神壇的生酮飲食到底行不行？
2021-08-19
學python培訓到底能幹嘛
2021-05-31
Python
努比亞X真機曝光：號稱“最全面全面屏” 10月31日釋出
2018-10-29
號稱能將STW幹掉1ms以內的Java垃圾收集器ZGC到底是個什麼東西？
2021-01-15
JavaGC
.net core 到底行不行！超高穩定性和效能的客服系統：效能實測
2023-11-06
購買Javascript核心原理解析優惠碼
2019-11-11
JavaScript
this 全面解析
2019-08-20
this全面解析
2018-12-26
mlp
2024-07-08
xenomai核心解析之訊號signal(二)---xenomai訊號處理機制
2020-07-18
AI
springboot自學（6）springboot核心原理
2024-08-05
Spring Boot
能打敗iPhone XS的手機來了？出自聯想，首發驍龍855！
2019-01-14
iPhone
o1帶火的CoT到底行不行？新論文引發了論戰
2024-09-20
微服務架構的核心要點和實現原理解析
2018-08-28
微服務架構
[深度學習]多層感知機（MLP）
2024-04-13
深度學習
this 全面解析（一）
2019-04-02
this全面解析（二）
2019-04-08
JavaScriptCore全面解析
2019-01-22
JavaScript
數學符號的來歷
2019-01-12
符號
（2）使用的數學符號
2018-08-20
符號
RSA 數學原理
2019-03-04

號稱能打敗MLP的KAN到底行不行？數學核心原理全面解析

KAN

相關文章