Google釋出pQRNN新NLP模型:基於投影的高效模型架構

banq發表於2020-09-22

谷歌釋出了一種NLP模型,稱為pQRNN,它以最小的模型尺寸提高了NLP效能的最新水平。pQRNN的新穎之處在於它如何將簡單的投影操作與準RNN編碼器相結合,以實現快速,並行的處理。該模型可在文字分類任務上實現接近BERT級別的效能,同時使用的模型引數要少幾個數量級。
 
通常上一代模型PRADO的做法是:首先將輸入到NLP模型的文字處理為適合於神經網路的形式,方法是將文字分割成與預定義的通用字典(所有可能的標記列表)中的值相對應的片段(標記)。然後,神經網路使用可訓練的引數向量(包含嵌入表)唯一地標識每個段。但是,文字的分割方式會對模型的效能,大小和延遲產生重大影響。
基於PRADO改進的pQRNN模型由三個構建塊組成:一個將文字中的令牌轉換為三元向量序列的投影運算子,一個密集的瓶頸層和一個QRNN編碼器堆疊組成。

點選標題見原文

相關文章