一句話解釋Transformer

banq發表於2024-06-28


一句話總結Transformer :

  • Transformer 是一種神經網路,擅長理解序列資料的上下文並從中生成新資料。
  • Transformer 是第一個完全依賴自注意力機制而不使用 RNN 或卷積的網路。

Transformer 就像一個黑匣子 想象一下,用於語言翻譯的 Transformer 就像一個黑匣子。

  • 輸入:一種語言的一句話。
  •  輸出:它的翻譯。

但是這個黑匣子裡發生了什麼?讓我們來一探究竟!

碼器/解碼器架構

  • - 輸入:西班牙語句子 "¿De quién es?
  • - 編碼器將其轉換為結構化格式,捕捉其精髓。
  • - 解碼器接收編碼資料並生成譯文。
  • - 輸出:翻譯後的句子:"這是誰的呢?"

每個編碼器和解碼器都由多層組成。它們的工作原理如下:

  •  編碼器:逐層、按順序處理輸入。 •
  • 解碼器:獲取編碼資料並逐步生成輸出。

兩者都使用了自注意和前饋神經網路,從而能夠生成自然語言。

相關文章