LeCun:深度學習在訊號理解中的強大和侷限(視訊+PPT)

量子位發表於2018-04-22
嶽排槐 發自 麥蒿寺
量子位 出品 | 公眾號 QbitAI

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

4月19日,LeCun在ICASSP(國際聲學、語音與訊號處理會議,訊號處理及應用領域的頂級會議)上發表了一次演講。

在演講中,LeCun談到了影像變換網路(GTN),並且簡要提到語音領域一些人正在研究輸入為原始訊號的端到端語音識別系統,這個系統的訓練也在序列層級。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

作為一個正規化,GTN的多模組可訓練系統將影像作為輸入,而且輸出同樣是影像。(而不是常規深度學習中的多維數值陣列)圖中的邊和節點攜帶多維數值或符號值(影像、標籤、得分等等)。

這允許通過諸如圖形組合、波束搜尋、前向演算法等進行反向梯度傳播。關於GTN的第一篇論文,就是在1997年的ICASSP大會上發表的。

640?wx_fmt=jpeg

LeCun此次演講的視訊全程請看:


如果你對其中的全套PPT感興趣,可以在量子位公眾號(ID:QbitAI)對話介面,回覆:“ASSP”四個字母,即可獲得下載地址。

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。

640?wx_fmt=jpeg

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態


相關文章