作者: James Kobielus
編譯: AI100
原文地址:
http://www.kdnuggets.com/2016/12/ibm-predictions-deep-learning-2017.html
隨著2017年的到來,深度學習技術也迎來了新的一年。深度學習是一門基於多層神經網路的技術,此項技術是許多顛覆性技術(如人工智慧、認知計算、實時資料流分析等)的基礎。
對資料科學家來說,深度學習技術將成為一門頂級焦點技術,下面我將對2017年深度學習的發展趨勢做一些預測:
第一個深度學習的消費級爆款應用上市
在新的一年裡,將會出現一款面向大眾消費級的深度學習應用,這款應用將會取得巨大的成功。消費者將會親身體驗到深度學習給他們的生活帶來的便利。這款應用可能出現在以下幾個方面。一、影象方面,現在很多圖片都來自於智慧手機拍攝或社交網路分享,所以我認為這個應用可能會出現在照片處理方面。深度學習將根植於app軟體上,用以改善圖片檢索、自動標記、自動校正、圖片渲染、照片級渲染、解析度增強、風格轉換、等方面。二、語音方面,在2017年,深度學習技術很可能在音樂作曲方面取得巨大成功,到時基於深度學習技術創作出來的曲子可能跟作曲家創作出來的曲子沒什麼區別。三、可穿戴裝置方面,可以幫助患有眼疾、耳疾的人,提高他們的視力、聽力。此外,在2017年深度學習技術還將以一種恰當的方式滲入到玩具、遊戲等消費市場中,尤其是那些內建攝像頭、麥克風、物聯網的裝置都將會嵌入深度學習技術。在某種程度上說,基於深度學習的自動駕駛汽車也可能會面市,但並不會進入主流市場,因為其目前還面臨著一些技術、法律問題。
主導深度學習開源工具庫席捲整個開源社群。
在2016年,很多機構開源了其深度學習工具。如谷歌開源了DeepMind與TensorFlow 原始碼,蘋果開源了它的AIReseach,非盈利組織OpenAI開始構建其深度學習基準評測技術。開發者已經可以使用Scala、Python、Java等語言在開園工具Spark 上開發深度學習應用了。深度學習框架除了DeepMind和TensorFlow,還有Keras、Caffe、 Theano,、Torch,、OpenBLAS 、Mxnet和DeepLearning4J等。
在接下來的2017年,深度學習開源工具將還會增加,但是我可以很確定的告訴大家,上面所說的眾多開源工具中至少有一個將會佔據主導地位,稱為眾多開發者喜愛。在接下來的這十年間,但凡是資料處理平臺,都必須整合至少一種深度學習開發工具和庫,能與Spark, Zeppelin, R 和 Hadoop 緊密整合。因此,我預計 Apache Spark將會在未來的12到24個月內有所改變,增加對深度學習相關開發的支援。
價格低廉的新一代深度學習晶片面市
由於深度學習技術依賴於多層神經網路、高維資料物件。所以深度學習需要在一個高度並行的架構中進行快速運算,這樣才能對物體、面部、語音等複雜物件進行識別。而我們要處理的高維深度學習模型越來越多,這就意味著我們需要處理速度更快、價格更低、擴充套件效能更好、更靈活的硬體。此外,由於新資料的加入、不同資料之間的合併、更加複雜的學習演算法等因素都會導致要處理的資料維度增加,因此我們的硬體應該能夠處理這種資料維度不斷增加的資料集,同時還能夠對這些高維資料進行持續處理
深度學習的廣泛使用離不開那些可以實現演算法加速的低成本硬體,在2017年,我們將看到新一代神經網路晶片、GPU還有其它高效能深度學習優化架構的大規模上市,越來越多的基於奈米技術的元件也將為這些嵌入到手機、物聯網中的深度學習應用提供堅實基礎。
深度學習演算法將變得更加複雜、更加多樣。
對於大多數資料專家,深度學習還是一門相對神祕、專業、令人生畏的技術。在即將到來的2017年,隨著深度學習應用的不斷增加,我們的資料專家與研發人員將不得不對以下邊緣技術進行了解,這些技術包括:遞迴神經網路、卷積神經網路、深度置信網路、受限玻爾茲曼機、多層自編碼器等技術。除此以外,正如我們在部落格中所講,深度學習專家也需要關注一些新的複雜演算法,這些演算法包括遺傳演算法、粒子群優化演算法、計算經濟學演算法等
同時我們資料科學家還需要在一些創新演算法上有所建樹,例如特徵自動抽取、遷移學習、資料降維、深度學習中分散式加速訓練等技術。研發人員在開發深度學習專案的時候會面臨各種各樣的困難,這就要求他們能夠將‘傳統AI學派’的工具與技術融合進來,最終解決問題。同時深度學習中也面臨著複雜的設計與優化問題,為了給這一問題提供一個指導方案,我們的資料科學家也需要嘗試著構建一個標準的深度學習開發框架