這是份值得收藏的2017年AI與深度學習要點大全

深度學習世界發表於2018-01-02

AI深度學習

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

2017已經正式離我們遠去~ ~ ~

部落格WILDML的作者、曾在Google Brain做了一年Resident的Denny Britz，就把他眼中的2017年AI和深度學習的大事，進行了一番梳理彙總。

小編將概要摘錄如下，詳情可前往原文檢視：

強化學習稱霸人類遊戲

如果說2016年AlphaGo擊敗李世乭之後，大家對它的棋壇地位還有些許懷疑的話，2017年擊敗柯潔，讓它成了毫無疑問的圍棋霸主。

作為一個強化學習Agent，它的第一個版本使用了來自人類專家的訓練資料，然後通過自我對局和蒙特卡洛樹搜尋的改進來進化。

不久之後，AlphaGo Zero更進一步，使用了之前一篇論文Thinking Fast and Slow with Deep Learning and Tree Search提出的技術，從零開始下圍棋，在訓練中沒有用到人類對局的資料。

如果說2016年AlphaGo擊敗李世乭之後，大家對它的棋壇地位還有些許懷疑的話，2017年擊敗柯潔，讓它成了毫無疑問的圍棋霸主。

作為一個強化學習Agent，它的第一個版本使用了來自人類專家的訓練資料，然後通過自我對局和蒙特卡洛樹搜尋的改進來進化。

640?wx_fmt=jpeg

相關論文：

AlphaGo
https://storage.googleapis.com/deepmind-media/alphgo/AlphaGoNaturePaper.pdf
AlphaGo Zero
https://www.nature.com/articles/nature24270.epdf
AlphaZero
https://arxiv.org/abs/1712.01815
Thinking Fast and Slow with Deep Learning and Tree Search
https://arxiv.org/abs/1705.08439

640?wx_fmt=jpeg

AI今年取得重大進展的遊戲不止圍棋。CMU研究人員的Libratus（冷撲大師）在20天的一對一無限注德州撲克比賽中，擊敗了人類頂級撲克玩家。

再早些時候，查爾斯大學、捷克技術大學和加拿大阿爾伯塔大學開發的DeepStack，首先擊敗了專業德撲玩家。

有一點值得注意，這兩個程式玩的都是一對一撲克，也就是兩名玩家之間的對局，這比多人遊戲更容易。2018年，我們很可能看到演算法在多玩家撲克上取得一些進步。

Libratus論文：
http://science.sciencemag.org/content/early/2017/12/15/science.aao1733.full

用強化學習玩人類遊戲的下一個領域，似乎是更復雜的多人遊戲，除了多人撲克之外，還有星際爭霸、DotA等等。DeepMind正在積極研究星際爭霸2，釋出了相關的研究環境。

星際爭霸2研究環境：https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/

而OpenAI在DotA中單比賽中取得了初步的成功，玩轉5v5遊戲，是他們的下一步目標

進化演算法迴歸

對於監督學習來說，基於梯度的反向傳播演算法已經非常好，而且這一點可能短期內不會有什麼改變。

然而，在強化學習中，進化策略（Evolution Strategies, ES）似乎正在東山再起。因為強化學習的資料通常不是lid（獨立同分布）的，錯誤訊號更加稀疏，而且需要探索，不依賴梯度的演算法表現很好。另外，進化演算法可以線性擴充套件到數千臺機器，實現非常快的平行訓練。它們不需要昂貴的GPU，但可以在成百上千便宜的CPU機器上進行訓練。

2017年早些時候，OpenAI的研究人員證明了進化策略實現的效能，可以與Deep Q-Learning等標準強化學習演算法相媲美。

相關論文：
https://arxiv.org/abs/1703.03864

年底，Uber內部一個團隊又連發5篇論文，來展示遺傳演算法和新穎性搜尋的潛力。他們使用非常簡單的遺傳演算法，沒有任何梯度資訊，學會了玩各種雅達利遊戲。他們的進化演算法在Frostbite遊戲中達到了10500分，而DQN、AC3、ES等演算法在同樣的遊戲中得分都不到1000。

很可能，2018年我們會在這個方向看到更多的工作。

640?wx_fmt=jpeg

WaveNets，CNNs以及注意力機制

谷歌的Tacotron 2文字轉語音系統效果令人印象深刻。這個系統基於WaveNet，也是一種自動迴歸模型，也被部署於Google Assistant之中，並在過去一年得到快速提升。

遠離昂貴且訓練漫長的迴歸架構是一個更大的趨勢。在論文Attention is All you Need裡，研究人員完全擺脫了迴圈和卷積，使用一個更復雜的注意力機制，只用了很小的訓練成本，就達到了目前最先進的結果。

論文地址：https://arxiv.org/abs/1706.03762

深度學習框架這一年

如果非要用一句話總結2017，那隻能說是框架之年。

Facebook搞出了PyTorch，這個框架得到了搞自然語言處理的研究人員大愛。

TensorFlow在2017年繼續領跑，目前已經發布到1.4.1版本。除了主框架之外，還發布了多個伴隨庫。TensorFlow團隊還發布了一個全新的eager execution模式，類似PyTorch的動態計算圖。此外：

蘋果釋出了CoreML移動機器學習庫；
Uber的一個團隊釋出了Pyro，一個深度概率程式語言；
亞馬遜宣佈在MXNet上提供更高階別的API Gluon；
Uber釋出了內部米開朗基羅機器學習基礎設施平臺的詳情；
由於框架已經太多，Facebook和微軟宣佈推出ONNX開放格式，以便跨框架共享深度學習模型。

除了通用的深度學習框架外，我們還看到大量的強化學習框架釋出：

OpenAI Roboschool，用於機器人模擬 https://blog.openai.com/roboschool/
OpenAI Baselines，一套強化學習演算法的高質量實現 https://github.com/openai/baselines
Tensorflow Agents，用TensorFlow來訓練RL智慧體 https://github.com/tensorflow/agents
Unity ML Agents，研究人員可用Unity Editor來建立遊戲，並展開強化訓練 https://github.com/Unity-Technologies/ml-agents
Nervana Coach，用最先進的強化學習演算法進行試驗 http://coach.nervanasys.com/
Facebook ELF，遊戲研究平臺 https://code.facebook.com/posts/132985767285406/introducing-elf-an-extensive-lightweight-and-flexible-platform-for-game-research/
DeepMind Pycolab，定製化的遊戲引擎 https://github.com/deepmind/pycolab
Geek.ai MAgent，多智慧體強化學習平臺 https://github.com/geek-ai/MAgent

為了讓深度學習更易普及，還有一些面向web的框架，例如谷歌的deeplearn.js和MIL WebDNN執行框架。

2017，還有一個流行框架跟我們告別了，那就是Theano。

學習資源

隨著深度學習和強化學習越來越流行，2017年有越來越多的課程、訓練營等活動舉行並分享到網上。以下是我最愛的一些。

Deep RL Bootcamp，由OpenAI和UC Berkeley聯合主辦，主要講授關於強化學習的基礎知識和最新研究成果https://sites.google.com/view/deep-rl-bootcamp/lectures?authuser=0
史丹佛視覺識別卷積神經網路課程2017春季版 http://cs231n.stanford.edu/
史丹佛自然語言處理與深度學習課程2017冬季版 http://web.stanford.edu/class/cs224n/
史丹佛的深度學習理論課程 https://stats385.github.io/
Coursera上最新的深度學習課程 https://www.coursera.org/specializations/deep-learning
蒙特利爾深度學習和強化學習暑期學校 http://videolectures.net/deeplearning2017_montreal/
UC Berkeley的深度強化學習課程2017秋季版 http://rll.berkeley.edu/deeprlcourse/
TensorFlow開發者大會上關於深度學習和TensorFlow API相關的內容 https://www.youtube.com/playlist?list=PLOU2XLYxmsIKGc_NBoIhTn2Qhraji53cv

幾大學術會議，延續了在網上釋出會議內容的新傳統。如果你想趕上最尖端的研究，可以檢視這些頂級會議的錄影資料。

NIPS 2017：
https://nips.cc/Conferences/2017/Videos
ICLR 2017：
https://www.facebook.com/pg/iclr.cc/videos/
EMNLP 2017：
https://ku.cloud.panopto.eu/Panopto/Pages/Sessions/List.aspx

研究人員也開始在arXiv上釋出低門檻的教程和綜述論文。以下是過去一年我的最愛。

深度強化學習：概述
Deep Reinforcement Learning: An Overview https://arxiv.org/abs/1701.07274
給工程師的機器學習簡介
A Brief Introduction to Machine Learning for Engineers https://arxiv.org/abs/1709.02840
神經機器翻譯
Neural Machine Translation https://arxiv.org/abs/1709.07809
教程：神經機器翻譯和序列到序列模型
Neural Machine Translation and Sequence-to-sequence Models: A Tutorial https://arxiv.org/abs/1703.01619

應用：AI和醫學

2017年，有不少人宣稱用深度學習解決了醫療問題，而且還擊敗了人類專家。這其中有真正的突破，也有一些炒作。對這方面感興趣的話，推薦關注Luke Oakden-Rayner的人類醫生終結系列部落格：

https://lukeoakdenrayner.wordpress.com/2017/04/20/the-end-of-human-doctors-introduction/

這裡簡要介紹一些發展。其中最重要的事件包括：史丹佛的一個團隊公佈了用深度學習識別皮膚癌的演算法細節。

相關研究：https://cs.stanford.edu/people/esteva/nature/

另一個史丹佛的團隊則開發了一個模型，能比人類專家更好的發現心律失常。

相關研究：https://stanfordmlgroup.github.io/projects/ecg/

640?wx_fmt=jpeg

當然也有一些風波。例如DeepMind與NHS之間的問題；NIH釋出了一個不適合訓練AI的胸部X光片資料集等等。

應用：藝術和GAN

應用於影像、音樂、繪圖和視訊領域的生成模型，今年也越來越受到關注。NIPS 2017還首次推出了面向創意與設計的機器學習研討會

640?wx_fmt=jpeg

最流行的應用之一是谷歌的QuickDraw，使用神經網路來識別你的塗鴉。基於已經發布的資料集，你甚至可以讓機器幫你畫完草稿。

一起去玩一下：
https://quickdraw.withgoogle.com/

GAN今年取得了不少重大進展。例如CycleGAN、DiscoGAN、StarGAN等新模型在生成人臉方面令人印象深刻。GAN通常難以生成逼真的高解析度影像，但pix2pixHD改變了這種現狀。

相關地址：
CycleGAN
https://arxiv.org/abs/1703.10593
DiscoGAN
https://github.com/carpedm20/DiscoGAN-pytorch
StarGAN
https://github.com/yunjey/StarGAN

應用：無人車

無人車領域的大玩家包括Uber、Lyft、Waymo和Tesla。Uber這一年都麻煩不斷，但是這家公司一直沒有停下在無人車方面的腳步。

Waymo在亞利桑那的鳳凰城進行了一系列無人車實驗，還公佈了測試和模擬技術的細節。Lyft正在建立自己的無人車硬體和軟體體系。特斯拉的Autopilot沒有太多更新。

640?wx_fmt=png

當然還有一個“新的”入局者，庫克證實蘋果公司也在研究自動駕駛。

超酷的研究和應用

今年有很多好玩的專案和展示，這裡不可能提及所有：

- 通過深度學習去除背景 https://towardsdatascience.com/background-removal-with-deep-learning-c4f2104b3157
- 通過深度學習創造動漫角色 http://make.girls.moe/#/
- 使用神經網路著色黑白照片 http://igeekbar.com/igeekbar/post/&
- 馬里奧賽車（SNES）由神經網路發揮 https://www.polygon.com/2017/11/5/16610012/mario-kart-mariflow-neural-network-video
- 實時馬里奧卡丁車64 AI https://github.com/rameshvarun/NeuralKart
- 使用深度學習發現偽造 https://www.technologyreview.com/s/609524/this-ai-can-spot-art-forgeries-by-looking-at-one-brushstroke/
- 隨手畫貓https://affinelayer.com/pixsrv/index.html

在研究層面
無監督情緒神經元 - 一個可以學習情緒的系統，儘管只被亞馬遜訓練用於預測評論的下一個字元。 https://blog.openai.com/unsupervised-sentiment-neuron/
學會溝通 - 智慧體“開發”了自己的語言。 https://blog.openai.com/learning-to-communicate/
習得索引結構 - 使用神經網路優化快取記憶體B-Tree。 https://arxiv.org/abs/1712.01208
Attention is All You Need - Google推出的翻譯架構Transformer完全捨棄了RNN/CNN結構。 https://arxiv.org/abs/1706.03762
Mask R-CNN https://arxiv.org/abs/1703.06870
Deep Image Prior，影像去噪、超解析度和修補。

資料集

神經網路需要大量的資料，因此開放資料集是對行業的重要貢獻。以下是今年幾個新推出的資料集代表。

Youtube Bounding Boxes
https://research.google.com/youtube-bb
Google QuickDraw Data
https://quickdraw.withgoogle.com/data
DeepMind Open Source Datasets
https://deepmind.com/research/open-source/open-source-datasets
Google Speech Commands Dataset
https://research.googleblog.com/2017/08/launching-speech-commands-dataset.html
Atomic Visual Actions
https://research.google.com/ava/
Several updates to the Open Images data set
https://github.com/openimages/dataset
Nsynth dataset of annotated musical notes
https://magenta.tensorflow.org/datasets/nsynt
Quora Question Pairs
https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs