場景描述:AI 頂會 IJCAI 2019 已於 8 月 16 日圓滿落幕。在連續 7 天的技術盛會中,與會者在工作坊瞭解了 AI 技術在各個領域的應用場景,聆聽了 AI 界前輩的主題演講,還有機會在圓桌會中瞭解, AI 發展歷史故事以及最新進展與趨勢。此外,會議收錄的論文無疑是最受關注的內容,我們特此分領域整理了多篇精選論文,與大家分享。關鍵詞:IJCAI 2019 論文
人工智慧頂級會議 IJCAI 2019 於 8 月 10 日至 8 月 16 日 ,在中國澳門舉行並圓滿落幕。
在 8 月 13 日的開幕式上,大會主辦方對本次大會的論文收錄情況進行了梳理。大會主席 Thomas Eiter 公佈了以下資訊:今年的 IJCAI 共收到 4752 篇論文提交,最終收錄數量達到了歷史新高 850 篇,錄取率為 17.9% 。
隨後大會的程式委員主席 Sarit Kraus 對論文的情況作了詳細的說明,相比於去年收錄的 3470 篇,今年增長率為 37% ,收錄的 850 篇論文中,有 327 篇來自中國,佔比 38%。
在論文的主題上,機器學習依然是最熱的一個領域,收錄數量為 438 篇,超過半數,此外論文數量最多的領域依次為計算機視覺,機器學習應用,自然語言處理。
提交論文中,共有 2516 篇為機器學習領域
今年共有 73 位領域主席以及 740 位高階程式委員會成員以及 2696 位程式委員會成員參與論文評審。由他們評審出來的優秀論文都有哪些呢?
百裡挑一的獲獎論文
IJCAI 2019 從 850 篇論文中評選出一篇傑出論文(Distinguished Paper):
論文地址:https://www.ijcai.org/proceed...
摘要:作者研究了一種基於對比條件下的分類問題。這種問題一般是這樣的:給定一個集合,只能獲得三元組資訊,這個三元組的資訊是三個目標的對比,如 x_i 到 x_j 的距離比 x_i 到 x_k 的距離小,怎樣將 x_i 分類呢?在這篇論文中,研究人員提出了名為「TripletBoost」的演算法,可以從這樣的三元組資料中學習分類器。論文的主要思想是,將三元組帶來的距離資訊輸入一個弱分類器中,可以序列化地逐步提升為一個強分類器。
這樣的方法有兩個優勢:首先這種方法可以應用在各種矩陣空間中,另外這個方法可以解決很多領域中,只能被動獲得的或者噪聲的三元組資訊。研究人員在論文中理論上驗證了這一方法的可行性,並提出了需要獲得的三元組數量的下限。通過實驗,他們說這種方法相比現有的方法更好,並且能夠更好的抵抗噪聲。
獲得 IJCAI-JAIR 最佳論文(Best Paper)的是:
論文地址:https://www.jair.org/index.ph...
注:這一獎項頒發給過去五年裡發表在 JAIR 上的論文。
摘要:該論文表示,最典型的 NP 完全問題(NP-complete),布林可滿足性(SAT)和它 PSPACE-complete 泛化版的量化布林可滿足性(QAT)是宣告式程式設計正規化的核心,它能高效解決各種計算性複雜問題在現實世界中的例項。
該領域的成功是通過在 SAT 和 QSAT 決策程式的實際實現上,即 SAT 和 QSAT 求解器上的突破而實現的。在這篇論文中,研究者開發並分析了用於預處理和後處理的子句消除(clause elimination)過程。其中子句消除過程形成了一套 (P)CNF 形式化簡化技術,因此在保持公式可滿足性的同時,在多項式時間內去除具有特定冗餘特性的子句。
除了這些獲獎論文外,作為人工智慧領域最火熱的頂級會議之一,IJCAI 歷年論文提交量與接收量都居頂會前幾位,誕生其中的優秀論文還有很多。
因此,超神經從本屆 IJCAI 大會最熱的三個領域(Hot 3)中,分別挑選一至兩篇精選論文,進行簡單的介紹,從而窺斑見豹,一睹 IJCAI 的全貌。
最熱領域之 Hot 1:機器學習
機器學習精選論文 1
論文地址:
https://www.ijcai.org/proceed...
摘要:開放式視訊問答任務(Video Question Answering),是根據給定的問題,從參考的視訊內容中自動生成文字的答案。
目前,現有的方法常採用多模態迴圈編解碼器網路,但它缺乏長期的依賴關係建模,致使無法有效地應用於長視訊問答中。
為了解決這個問題,作者提出了一種快速分層卷積自注意編解碼器網路(HCSA)。使用具有分層卷積的自注意編碼器,有效地對長視訊內容進行建模。
HCSA 建立了視訊序列的層次化結構,並從視訊上下文中捕獲具有問題感知能力的長期依賴關係。此外,還設計了一種多尺度注意力解碼器,該解碼器融合了多層表示來生成答案,避免了頂層編碼層的資訊缺失。
試驗結果表明,該方法在多個資料集上表現良好。
機器學習精選論文 2
論文地址:
https://www.ijcai.org/proceed...
摘要:機器學習的應用往往受到有效標記資料數量的限制,而半監督學習可以有效解決這個問題。
本文提出一種簡單有效的半監督學習演算法——插值一致性訓練(Interpolation Consistency Training,ICT)。
ICT 使未標記點的插值預測與這些點的插值預測保持一致。在分類問題中,ICT 將決策邊界移動到資料分佈的低密度區域。它幾乎不使用額外的計算,也不需要訓練生成模型,即使沒有廣泛的超引數調優,它在 CIFAR-10 和 SVHN 基準資料集上應用於標準的神經網路體系結構時,達到了最先進的效能。
最熱領域之 Hot 2:計算機視覺
計算機視覺精選論文 1
論文地址:
https://www.ijcai.org/proceed...
摘要:來自多個尺度的特徵可以極大地幫助語義邊緣檢測任務,然而,普遍的語義邊緣檢測方法應用固定權重融合策略,其中具有不同語義的影象被迫共享相同的權重,導致所有影象和位置的通用融合權重,而不管它們的不同語義或區域性上下文。
這項工作提出了一種新穎的動態特徵融合策略,自適應地為不同的輸入影象和位置分配不同的融合權重。通過建議的權重學習器來實現的,以針對特定輸入以特徵地圖的每個位置的多級特徵推斷出適當的融合權重。
以這種方式,可以更好地考慮由特徵圖和輸入影象的不同位置做出的貢獻的異質性,從而有助於產生更準確和更清晰的邊緣預測。
計算機視覺精選論文 2
論文地址:
https://www.ijcai.org/proceed...
摘要:單目深度估計是場景理解的一項重要任務。複雜場景中物體和物體的底層結構對於精確恢復且視覺效果好的深度地圖至關重要。全域性結構反映場景佈局,區域性結構反映形狀細節。近年來發展起來的基於 CNN 的深度估計方法顯著提高了深度估計的效能。然而,其中很少考慮複雜場景中的多尺度結構。
本文提出了一種利用多尺度結構進行深度精確預測的結構感知剩餘金字塔網路(SARPN),還提出了一種殘差金字塔解碼器(RPD),它在上層表示全域性場景結構來表示佈局,在下層表示區域性結構來表示形狀細節;在每一層,提出預測殘差對映的殘差細化模組(RRM),以逐步在上層預測的粗糙結構上新增更精細的結構;為了充分利用多尺度影象的特徵,提出了一種自適應密集特徵融合(ADFF)模組,該模組自適應融合各尺度的有效特徵,用於對各尺度結構進行推理。在 NYU-Depth v2 資料集上的實驗結果表明,本文提出的方法在定性和定量評估方面都達到了最先進的效能,精度達到 0.749,召回率達到 0.554 ,F1 分數達到 0.630。
最熱領域之 Hot 3:自然語言處理(NLP)
NLP 精選論文 1
論文地址:
https://www.ijcai.org/proceed...
摘要:遞迴神經網路(RNNs)被廣泛應用於自然語言處理(NLP)領域,包括文字分類、問答和機器翻譯等方面。通常情況下 RNNs 只能從頭到尾審閱,處理長文字能力較差。而文字分類任務中,長文件中的大量單詞是不相關的,可以被跳過。針對這種情況,本文作者提出增強型 LSTM:Leap-LSTM。
Leap-LSTM 可以在閱讀文字時動態地在單詞之間進行跳轉。在每個步驟中 Leap-LSTM 使用幾個特徵編碼器從前面的文字、後面的文字和當前的單詞中提取資訊,然後決定是否跳過當前的單詞。在 AGNews、DBPedia、Yelp F. Yelp P. 和 Yahoo 共五個基準資料集上,Leap-LSTM 的預測效果均高於標準 LSTM ,並且 Leap-LSTM 具有更高的讀取速度。
NLP 精選論文 2
論文地址:
https://www.ijcai.org/proceed...
摘要:該論文研究了基於知識圖譜嵌入的實體對齊問題。之前的工作主要關注實體的關係結構,有些還進一步合併了其他型別的特性,例如屬性,以進行細化。
然而,大量的實體特性仍然沒有被平等地放在一起處理,這損害了基於嵌入的實體對齊的準確性和強健性。
本文提出了一個新的框架,它統一了實體的多個檢視來學習實體對齊的嵌入。具體來說,該論文使用幾種組合策略基於實體名稱、關係和屬性的檢視嵌入實體。
此外,該論文設計了一些跨知識圖譜推理方法來增強兩個知識圖譜之間的對齊,該論文在實際資料集上的實驗表明,該框架的效能顯著優於目前最先進的基於嵌入的實體對齊方法。所選擇的檢視、跨知識圖譜推理和組合策略都有助於效能的提高。
—— 完 ——