資源 | 機器學習十大熱文新鮮出爐，這個月你該讀哪篇？

AI科技大本營發表於2019-02-15

原文網址 : https://flycode.co/archives/289572

翻譯 |AI科技大本營（微信ID：rgznai100）

一直為開發者提供優質學習資源的Mybridge最近又釋出了一篇資源性文章：《2018年2月機器學習10大熱文精選》，這10篇文章是Mybridge是對近期釋出的1400篇文章進行了排名並挑選出來的。為了讓開發者對文章有更直觀的瞭解，營長對這10篇資源進行了摘要式翻譯。

以下文章討論的話題主要包括：張量生成庫，Deepfakes，神經網路，深度強化學習，語音，DMLab-30,醫學影象分析，歌詞分析，IRL等。

（此前營長髮布過多篇收藏黨喜歡的文章，也是來自Mybridge：①Python 開源專案 Top 10 精選，平均star為1128！ ②從1400篇機器學習文章中精選出Top 10，幫你找找上班的感覺！ ③ 從15000個Python開源專案中精選的Top30，Github平均star為3707，趕緊收藏！ ④我們從8800個機器學習開源專案中精選出Top30，推薦給你）

▌No.1 張量生成庫（Tensor Comprehensions），由Facebook研究院提出。

Tensor Comprehensions是一個多功能的C++庫，利用Halide、ISL、NVRTC和LLVM框架，它能夠自動合成高效能的機器學習核心。此外，張量生成式庫提供了底層介面，能夠與Caffe2、PyTorch框架無縫銜接，實現很好的相容性。更多關於該庫的細節，我們將在論文中進行詳細說明，論文已發表在arXiv上。

Tensor Comprehensions作為一種全新的機器學習框架，它具有高度的便攜性，能夠輕鬆地嵌入到其他裝置上執行。不僅如此，它還兼具記憶體空間佔用少，易分流，同步性好等優點，只需要一個簡單的張量庫就能滿足需求。

github連結

▌No.2 如何利用deepfakes生成逼真的人臉照片。由 Sven Charleer提供。

Deepfakes是一個基於深度學習演算法的應用程式，它能夠自動學習如何構建人臉。給定一系列的人臉圖片，經過數個小時，它就能夠逼真地生成這些人臉圖片。值得注意得是，它並不是簡單地生成這些圖片的副本，而是通過學習這些人臉各自的構造，不同的表情來生成相應的人臉。

原文參見

▌No.3 如何使用CoreML、PyTorch和React Naive框架在iOS系統中搭建神經網路。由Stefano J.Attardi提供

這篇文章我主要闡述如何在iOS系統中使用一個已訓練好的神經網路來解決真實世界的問題。這些挑戰在每個iOS應用程式中都會出現的。

下面，我將從問題入手詳細說明每個問題的解決方案。首先，我們要逐步完成工具構建，資料集生成，神經網路模型的構建和在PyTorch上進行模型訓練。進一步，我們還將在CoreML上進行模型轉換，最終到達React Native UI。

原文參見

▌No.4 深度強化學習將不再有效。由Alexirpan提供

在過去幾年裡關於強化學習的研究，被引文章次數最多的高校或研究機構包括加州大學伯克利分校，Google Brain，DeepMind和OpenAI，我也是其中工作的參與者之一。這篇文章列舉了多則關於深度強化學習弊端和侷限性的內容。此外，在這份表單裡我可能遺漏掉其他一些機構的研究成果，在此表示歉意。

原文參見

▌No.5 前端要完？人工智慧已經能實現自動編寫 HTML 和 CSS。由Emil Wallner提供。（中文版）

在未來三年內，深度學習將改變前端開發，它可以快速建立原型，並降低軟體開發的門檻。

去年，該領域取得了突破性的進展，其中 Tony Beltramelli 發表了 pix2code 的論文[1]，而 Airbnb 則推出了sketch2code[2]。

目前，前端開發自動化的最大障礙是計算能力。但是，現在我們可以使用深度學習的演算法，以及合成的訓練資料，探索人工前端開發的自動化。

本文中，我們將展示如何訓練神經網路，根據設計圖編寫基本的 HTML 和 CSS 程式碼。

原文參見

▌No.6 用生成對抗網路實現語音合成。由 Chris Donahue提供

雖然生成對抗網路(GAN)在影象合成問題上已經取得了廣泛的成功，但還未在無監督式的音訊生成領域中得到應用。

與影象不同的是，解決音訊合成問題的一大障礙是區別不同音訊之間的表示法往往是不可逆的，因此這種表示法不能用於合成音訊輸出。在本文中，我們介紹一種WaveGAN模型，這是第一次嘗試在無監督的設定下將GAN應用於原始音訊合成問題。實驗結果表明，WaveGAN可以利用人類言語中的小詞彙生成可理解的詞彙，進一步地，這種方法對於其他領域的音訊合成問題同樣適用，例如鳥鳴，鼓聲和鋼琴聲。

我們的研究還表明，WaveGAN模型是生成對抗網路在音訊特徵表示問題上成功的應用，這對於人類法官的案件審判有很大的幫助。關於模型的詳細資訊可參見我們這篇論文：arxiv.org/pdf/1802.04…