AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
論文連結:https://arxiv.org/pdf/2410.23168
開原始碼:https://github.com/Haiyang-W/TokenFormer
開源模型:https://huggingface.co/Haiyang-W
由於 Tokenformer 完全基於注意力機制,它自然受益於在 Token-Parameter 互動中與注意力相關的可解釋性特性。這一特點增強了模型的可解釋性,為 AI 社群開發更透明、易理解的模型貢獻力量。