7 Papers | KDD2019最佳論文；AutoML SOTA 綜述

AIBigbull2050發表於2019-08-23

原文網址 : http://blog.itpub.net/69946223/viewspace-2654712/

機器之心整理

參與：一鳴

本週的看點是 KDD 2019 大會，分別有兩篇研究賽道和應用賽道最佳論文被選入。本週入選的其他論文都有架構或研究方法上新穎的點，如 CMU、加州大學聖迭戈分校等的基於語義的相似性的機器翻譯論文、喬治亞理工聯合 Facebook 和俄勒岡州立大學提出的多模態 BERT 模型等、提出反向傳播替代方法 HSIC 瓶頸的論文等。

Network Density of States
Actions Speak Louder than Goals: Valuing Player Actions in Soccer
Beyond BLEU: Training Neural Machine Translation with Semantic Similarity
The HSIC Bottleneck: Deep Learning without Back-Propagation
AutoML: A Survey of the State-of-the-Art
ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks
Trick Me If You Can: Human-in-the-Loop Generation of Adversarial Examples for Question Answering

1. 標題：Network Density of States

作者：Kun Dong、Austin R. Benson、David Bindel
論文連結：https://arxiv.org/pdf/1905.09758.pdf

摘要：在本文中，研究者深入探索了真實世界圖譜譜密度的核心。他們借用了凝聚態物理學中開發的工具，並新增了新的適應性來處理常見圖形的譜特徵。他們計算了單個計算節點上超過 10 億個邊的圖的譜密度，證明所得到的方法非常高效。除了提供視覺上引人注目的圖形指紋之外，研究者還展示了譜密度的估計如何簡化許多常見的中心度量的計算，並使用譜密度估計關於圖結構的有意義資訊，這些資訊不能僅從極值特徵對推斷出來。

推薦：這篇是 KDD 2019 的研究賽道最佳論文，作者來自 CMU 和康奈爾大學。

2. 標題：Actions Speak Louder than Goals: Valuing Player Actions in Soccer

作者：Tom Decroos、Lotte Bransen、Jan Van Haaren、Jesse Davi
論文連結：https://arxiv.org/pdf/1802.07127.pdf

摘要：評估足球運動員比賽中個人行動所造成的影響是評估他們的重要指標。然而，大多數傳統指標在解決此類任務時效果都不盡如人意，因為它們只關注整場比賽中僅有的幾次特殊動作，比如射門和進球——而忽視了行動的背景。研究人員提出的方法包括：一種用於描述球場上各個球員動作的新語言；基於它對比賽結果的影響來評估任何型別球員動作的框架，同時考慮了動作發生的背景。

推薦：解決「魔球」問題的一篇論文，獲得了 KDD 2019 應用賽道最佳論文。

3. 標題：Beyond BLEU: Training Neural Machine Translation with Semantic Similarity

作者：John Wieting、Taylor Berg-Kirkpatrick、Kevin Gimpel、Graham Neubig
論文連結：https://www.aclweb.org/anthology/P19-1427

摘要：在本文中，研究者提出以一種可替代的獎勵函式（reward function）來優化神經機器翻譯（NMT）系統，這種獎勵函式基於語義相似性的研究。研究者對四種翻譯成英文的語言展開評估，結果發現：利用他們提出的*度量*進行訓練，可以產生較 BLEU、語義相似性和人工測評等評估標準更好的翻譯效果，並且優化過程的收斂速度更快。分析認為，取得更好翻譯效果的原因在於研究者提出的度量更有利於優化，同時分配部分分數（partial credit），提供較 BLEU.1 更強的分數多樣性。

在幾種評價方法下，將四種語言翻譯為英語的模型表現。論文提出的模型「SimiLe」的表現超過了 BLEU 和 MLE。† 表示超過了 BLEU 的結果具有統計顯著性（p < 0.05），而 ‡ 說明超過了 MLE 的結果具有統計顯著性（p < 0.05）。

推薦：一篇較少見的基於語義相似性的機器翻譯論文。推薦想要繼續研究這一領域的讀者看看最新的研究進展。

4. 標題：The HSIC Bottleneck: Deep Learning without Back-Propagation

作者：Wan-Duo Kurt Ma、J.P. Lewis、W. Bastiaan Kleijn
論文連結：https://arxiv.org/pdf/1908.01580v1.pdf

摘要：在本文中，研究者介紹了用於訓練深度神經網路的希爾伯特·施密特獨立準則（Hilbert-Schmidt independence criterion，HSIC）瓶頸。HSIC 瓶頸是傳統反向傳播的一種替代方法，具有很多明顯的優勢。該方法有利於並行處理，並且所需要的操作流程大幅度減少。此外，該方法還不會遭遇梯度爆炸或梯度消失的情況。從生物學的角度來看，由於不需要對稱反饋，所以該方法較反向傳播更為合理。研究發現，即使當不鼓勵系統輸出的結果類似於分類標籤時，HSIC 瓶頸在 MNIST/FashionMNIST/CIFAR10 分類中的表現與具有交叉熵目標的反向傳播相當。增加一個利用 SGD（無反向傳播）進行訓練的單一層能夠實現 SOTA 效能。

推薦：雖然反向傳播已經是神經網路的標配，但為何不能再提高下運算效率，解決梯度下降中的問題呢？文章提出的新型梯度下降方法，值得讀者瞭解最新的神經網路架構創新動向。

5. 標題：AutoML: A Survey of the State-of-the-Art

作者：Xin He、Kaiyong Zhao、Xiaowen Chu
論文連結：https://arxiv.org/pdf/1908.00709v1

摘要：在特定領域構建高質量的深度學習系統不僅耗時，而且需要大量的資源和人類的專業知識。為了緩解這個問題，許多研究正轉向自動機器學習。本文是一個全面的 AutoML 論文綜述文章，介紹了最新的 SOTA 成果。首先，文章根據機器學習構建管道的流程，介紹了相應的自動機器學習技術。然後總結了現有的神經架構搜尋（NAS）研究。論文作者同時對比了 NAS 演算法生成的模型和人工構建的模型。最後，論文作者介紹了幾個未來研究中的開放問題。

論文展示的在資料準備階段可由 AutoML 覆蓋的機器學習流程。

不同 NAS 演算法在 CIFAR10 資料集上的效能對比。

推薦：自動學習難入門？SOTA 模型學起來。

6. 標題：ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks

作者：Jiasen Lu、Dhruv Batra、Devi Parikh、Stefan Lee
論文連結：https://arxiv.org/pdf/1908.02265.pdf

摘要：研究人員提出了一種名為 ViLBERT（圖文 BERT）模型。這是一個可以學習任務未知的、影像內容和自然語言聯合表徵的模型。研究人員將流行的 BERT 架構擴充套件成一個 multi-modal two-stream 模型上。在這個模型上，模型用兩個分開的流處理影像和文字輸入，但他們彼此用聯合注意力層互動。研究人員在兩個代理任務上，使用 Conceptual Captions 資料集（資料集很大，而且是自動收集的資料）預訓練這個模型，然後將模型秦阿姨到多個建立好的影像-文字任務上。這些任務包括影像問答、影像常識推理、引述表達、指稱成分，以及基於捕捉的影像提取。這些只需要在基本架構上進行微小的補充。研究人員觀察到，相比現有的針對任務的特定模型，新模型在這些任務上都有了相助的效能提升——在每個任務上都取得了 SOTA。

ViLBERT 模型的架構。綠色和紫色的兩條 stream 分別輸入影像和文字資料，並使用聯合注意力層進行互動。這一結構可以學習影像和文字的聯合表徵。

推薦：使用 BERT 進行多模態的資料預訓練，這篇論文提供了一個新思路。論文作者來自喬治亞理工、Facebook 和俄勒岡州立大學。

7. 標題：Trick Me If You Can: Human-in-the-Loop Generation of Adversarial Examples for Question Answering

作者：Eric Wallace、Pedro Rodriguez、Shi Feng、Ikuya Yamada、Jordan Boyd-Graber
論文連結：https://doi.org/10.1162/tacl_a_00279
專案連結：https://github.com/Eric-Wallace/trickme-interface/

摘要：對抗評估（adversarial evaluation）強調測試模型對自然語言的理解能力。由於過去的方法只能發現表層的規律，獲得的對抗樣本只有有限的複雜性和多樣性。本文中，研究人員提出了一種人類參與的對抗樣本生成迴圈流程。在流程中，人類作者可以被引導用於中斷模型。研究人員給作者們提供了互動式介面，用於解釋模型的預測結果。研究人員在 Quizbowl 這一機器問答任務上使用提出的生成框架，由熱衷於 trivia 遊戲的人制作對抗問題。而最終生成的文字通過人機匹配進行驗證：儘管生成的問題對人類很普通，但可能會全面地難倒神經模型或資訊抽取模型。這些對抗樣本涵蓋了多種多樣的特徵，從多跳推理（multi-hop reasoning）到實體型別干擾項，暴露出了魯棒的機器問答研究中的許多開放挑戰。

生成對抗樣本的互動介面和資料展示。人類作者首先在右上寫下一個問題。而模型則會在左側提供預測結果，並解釋這樣推斷的原因（右下）。而人類作者可以選擇接受這個問題，用於迷惑模型。

推薦：機器問答任務中同樣需要各種各樣的對抗樣本來提升模型魯棒性。馬里蘭大學的這一研究可以幫助讀者朋友瞭解機器問答模型中的魯棒性問題。而引入人類因素的對抗樣本生成同樣值得借鑑。

https://www.toutiao.com/i6724469803882381838/

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69946223/viewspace-2654712/，如需轉載，請註明出處，否則將追究法律責任。

7 papers | 對抗樣本前，BERT也不行；AutoML的商業實踐綜述
2019-07-22
TOML
7 papers | 華為、MIT韓松論文；DeepMind開源OpenSpiel；目標檢測演算法全面綜述
2019-09-01
MIT演算法
7 Papers | 深度強化學習綜述、圖靈71年前未發表的智慧機器論文
2019-06-30
強化學習圖靈
NLP相關論文綜述
2018-11-26
7 papers｜EMNLP 2019最佳論文；Facebook語言模型XLM-R取得SOTA結果；最優學習的85%規則
2019-11-11
模型
聯邦學習綜述性論文
2024-08-08
聯邦學習
【讀論文】 -- 推薦系統研究綜述
2024-04-10
【論文筆記】A review of applications in federated learning（綜述）
2022-05-01
筆記ViewAPP
AutoML研究綜述：讓AI學習設計AI
2019-05-08
TOMLAI
如何入門論文閱讀&綜述小解答
2021-01-02
Attention模型方法綜述 | 多篇經典論文解讀
2018-06-11
模型
【論文筆記】Federated Learning for Wireless Communications: Motivation, Opportunities, and Challenges（綜述）
2022-05-03
筆記
【阿菜讀論文】區塊鏈共識演算法綜述
2021-08-01
區塊鏈演算法
Hugging Face 論文平臺 Daily Papers 功能全解析
2024-09-24
Hugging FaceAI
【Papers】Robust Lane Detection via Expanded Self Attention 論文解讀
2021-04-07
擴散模型首篇綜述+論文分類彙總，谷歌&北大最新研究
2024-03-12
模型谷歌
《基於深度學習的目標檢測綜述》論文獲發表
2023-01-30
深度學習
【論文筆記】A Survey on Federated Learning: The Journey From Centralized to Distributed On-Site Learning and Beyond（綜述）
2022-04-25
筆記Zed
ACL 2019對話系統論文綜述，一文帶你縱覽16篇前沿研究
2019-08-14
領域綜述 | 知識圖譜概論（一）
2019-03-22
綜述論文：當前深度神經網路模型壓縮和加速方法速覽
2019-03-02
神經網路模型
低質多模態資料融合，多家機構聯合出了篇綜述論文
2024-05-08
Spring綜述
2019-04-03
Spring
圖嵌入綜述(arxiv1709.07604)譯文4.3~4.7
2018-09-20
入侵檢測系統綜述文獻研讀
2024-06-01
7大類深度CNN架構創新綜述
2019-01-25
CNN架構
綜述論文：對抗攻擊的12種攻擊方法和15種防禦方法
2018-03-05
94頁論文綜述卷積神經網路：從基礎技術到研究前景
2018-04-07
卷積神經網路
Hugging News #0331: Hugging Papers 來啦，快來認領你的論文!
2023-04-02
自動機器學習簡述（AutoML）
2019-03-07
機器學習TOML
圖嵌入綜述(arxiv1709.07604)譯文五、六、七
2018-09-20
Spring Bean 綜述
2019-04-13
SpringBean
API安全綜述
2021-07-07
API
機器學習金融預測領域2023部分綜述論文閱讀記錄
2024-03-23
機器學習
300多篇相關研究，復旦、南洋理工最新多模態影像編輯綜述論文
2024-06-28
7 Papers & Radios | DeepMind等用AI小鼠探索神經網路；伯克利資料增強RL實現SOTA
2020-05-03
iOSAI神經網路
論文閱讀筆記 --- 圖模互補：知識圖譜與大模型融合綜述 --- 按參考文獻整理
2024-09-13
筆記大模型
視覺SLAM綜述
2019-03-09
視覺SLAM

7 Papers | KDD2019最佳論文；AutoML SOTA 綜述

相關文章