機器學習十大熱文新鮮出爐,這個月你該讀哪篇?

AI科技大本營發表於2018-03-05



翻譯 | 林椿眄

編輯 | SuiSui


一直為開發者提供優質學習資源的Mybridge最近又釋出了一篇資源性文章:《2018年2月機器學習10大熱文精選》 ,這10篇文章是Mybridge是對近期釋出的1400篇文章進行了排名並挑選出來的。為了讓開發者對文章有更直觀的瞭解,營長對這10篇資源進行了摘要式翻譯。


以下文章討論的話題主要包括:張量生成庫,Deepfakes,神經網路,深度強化學習,語音,DMLab-30,醫學影像分析,歌詞分析,IRL等。


此前營長髮布過多篇收藏黨喜歡的文章,也是來自Mybridge:①Python 開源專案 Top 10 精選,平均star為1128!   ②從1400篇機器學習文章中精選出Top 10,幫你找找上班的感覺!  ③ 從15000個Python開源專案中精選的Top30,Github平均star為3707,趕緊收藏!   ④我們從8800個機器學習開源專案中精選出Top30,推薦給你


No.1 張量生成庫(Tensor Comprehensions),由Facebook研究院提出。


Tensor Comprehensions是一個多功能的C++庫,利用Halide、ISL、NVRTC和LLVM框架,它能夠自動合成高效能的機器學習核心。此外,張量生成式庫提供了底層介面,能夠與Caffe2、PyTorch框架無縫銜接,實現很好的相容性。更多關於該庫的細節,我們將在論文中進行詳細說明,論文已發表在arXiv上。


Tensor Comprehensions作為一種全新的機器學習框架,它具有高度的便攜性,能夠輕鬆地嵌入到其他裝置上執行。不僅如此,它還兼具記憶體空間佔用少,易分流,同步性好等優點,只需要一個簡單的張量庫就能滿足需求。


github連結






No.2 如何利用deepfakes生成逼真的人臉照片。由 Sven Charleer提供。


Deepfakes是一個基於深度學習演算法的應用程式,它能夠自動學習如何構建人臉。給定一系列的人臉圖片,經過數個小時,它就能夠逼真地生成這些人臉圖片。值得注意得是,它並不是簡單地生成這些圖片的副本,而是通過學習這些人臉各自的構造,不同的表情來生成相應的人臉。


原文參見





No.3 如何使用CoreML、PyTorch和React Naive框架在iOS系統中搭建神經網路。由Stefano J.Attardi提供


這篇文章我主要闡述如何在iOS系統中使用一個已訓練好的神經網路來解決真實世界的問題。這些挑戰在每個iOS應用程式中都會出現的。


下面,我將從問題入手詳細說明每個問題的解決方案。首先,我們要逐步完成工具構建,資料集生成,神經網路模型的構建和在PyTorch上進行模型訓練。 進一步,我們還將在CoreML上進行模型轉換,最終到達React Native UI。


原文參見




No.4 深度強化學習將不再有效。由Alexirpan提供


在過去幾年裡關於強化學習的研究,被引文章次數最多的高校或研究機構包括加州大學伯克利分校,Google Brain,DeepMind和OpenAI,我也是其中工作的參與者之一。這篇文章列舉了多則關於深度強化學習弊端和侷限性的內容。此外,在這份表單裡我可能遺漏掉其他一些機構的研究成果,在此表示歉意。


原文參見





No.5 前端要完?人工智慧已經能實現自動編寫 HTML 和 CSS。 由Emil Wallner提供。(中文版


在未來三年內,深度學習將改變前端開發,它可以快速建立原型,並降低軟體開發的門檻。


去年,該領域取得了突破性的進展,其中 Tony Beltramelli 發表了 pix2code 的論文[1],而 Airbnb 則推出了sketch2code[2]。


目前,前端開發自動化的最大障礙是計算能力。但是,現在我們可以使用深度學習的演算法,以及合成的訓練資料,探索人工前端開發的自動化。


本文中,我們將展示如何訓練神經網路,根據設計圖編寫基本的 HTML 和 CSS 程式碼。


原文參見




No.6 用生成對抗網路實現語音合成。由 Chris Donahue提供


雖然生成對抗網路(GAN)在影像合成問題上已經取得了廣泛的成功,但還未在無監督式的音訊生成領域中得到應用。


與影像不同的是,解決音訊合成問題的一大障礙是區別不同音訊之間的表示法往往是不可逆的,因此這種表示法不能用於合成音訊輸出。 在本文中,我們介紹一種WaveGAN模型,這是第一次嘗試在無監督的設定下將GAN應用於原始音訊合成問題。 實驗結果表明,WaveGAN可以利用人類言語中的小詞彙生成可理解的詞彙,進一步地,這種方法對於其他領域的音訊合成問題同樣適用,例如鳥鳴,鼓聲和鋼琴聲。


我們的研究還表明,WaveGAN模型是生成對抗網路在音訊特徵表示問題上成功的應用,這對於人類法官的案件審判有很大的幫助。關於模型的詳細資訊可參見我們這篇論文:https://arxiv.org/pdf/1802.04208.pdf




No7. IMPALA:DMLab-30環境下的一種可擴充套件的分散式深度強化學習框架。 由DeepMind提供


DMLab-30是我們使用強化學習環境DeepMind Lab設計的一種全新的強化學習框架。在這些環境下,深度強化學習的研究人員都可以在單個或多工設定中對感興趣的一些問題進行研究,並系統地測試。


原文參見




No.8 深度學習在大腦磁共振影像問題中的應用。 由Henrik Marklund提供


這篇文章中我們將詳細討論醫學影像分割問題,其內容主要有以下幾個方面:


  • 影像分割問題

  • 腦磁共振影像資料

  • 腦影像分割問題所需面臨的三大挑戰

  • 腦腫瘤影像分割挑戰賽

  • 醫學上損傷影像分割例項分析(已達人類醫生水平)


原文參見




No.9 R語言在自然語言處理和機器學習領域的應用:用於歌詞合成分析。由 Debbie Liske提供


這是該系列教程的第一部分,在這篇文章中你將學習如何使用R語言對傳奇藝術家Prince的音樂歌詞進行研究分析,包括歌詞文字的挖掘,情感分析等。 這系列教程涵蓋以下三個部分的內容:


  • 第一部分:對歌詞進行文字挖掘和探索性分析

  • 第二部分:用自然語言處理的知識對歌詞進行情感分析和主題建模

  • 第三部分:用機器學習進行預測分析


原文參見




No.10 反轉式強化學習。 由Johannes Heidecke提供


在該系列文章中,我們將詳細研究反轉式強化學習(IRL)。它是通過觀察動作或行為特徵來學習代理的目標,價值或獎勵的一種學習策略。 例如,我們可以觀察一個人在某個特定任務中的行為,並瞭解人類試圖要達到的環境狀態及具體目標可能是什麼。


這是本系列文章的第一部分,我們首先將介紹IRL的概念,並進一步闡述解決IRL問題的三種基本演算法。在後面的文章中,我們將探索更先進的技術和最先進的方法。


原文參見




原文地址






相關文章