去掉一個「超權重」的影響,比去掉其他 7000 個離群值權重加起來還要嚴重。
大模型的引數量越來越大,越來越聰明,但它們也越來越奇怪了。
兩年前,有研究者發現了一些古怪之處:在大模型中,有一小部分特別重要的特徵(稱之為「超權重」),它們雖然數量不多,但對模型的表現非常重要。
如果去掉這些「超權重」,模型就完全擺爛了,開始胡言亂語,文字都不會生成了。但是如果去掉其他一些不那麼重要的特徵,模型的表現只會受到一點點影響。
論文連結:https://arxiv.org/pdf/2411.07191 論文標題:The Super Weight in Large Language Models
「超權重」的影響
引發「超啟用」; 抑制了停用詞(stopword)的生成機率。
原始模型; 移除「超權重」,將其權重設定為 0; 移除「超權重」,但恢復神經網路層中的「超啟用」。
「超權重」對輸出 token 機率分佈的影響
輸入 prompt 為:「Summer is hot. Winter is 」 下一個 token 應為「cold」,這是一個具有強語義的詞。
「超權重」的重要性