深度學習入行,現在門檻這麼低了嗎?

七月線上實驗室發表於2018-04-04

一篇標題“憂心忡忡”的討論帖,毫無意外的在reddit上炸了。原po主表示:進入門檻太低正在毀掉深度學習的名聲!

很長一段時間以來,我注意到很多自稱深度學習專家、大咖的人,其實名不副實。這些人沒有機器/深度學習的教育或者研究背景,只是裝上TensorFlow執行了一些GitHub上搞來的程式碼,然後就自認專家,寫部落格、寫教程、甚至出書。

這讓我很困擾,這破壞了深度學習的名聲。大多數公司不知道如何辨別這些所謂的“專家”,面試官也不懂深度學習,不在乎NIPS、ICML。所以當這些“專家”的深度學習解決方案不行時,這些公司就會認為一切只是一場炒作。

隨著這種情況越來越多,持懷疑態度的人就越來越多,連內行都開始談論泡沫了。大家怎麼看這個問題?你們同意我的看法麼?以後應該怎麼辦?

640?wx_fmt=jpeg

不少人跟帖反對上面這個論點,核心思想可以大概總結為:多研究些問題,少談些主義

與po主的觀點相反,開放性或者說“門檻低”是機器學習社群最好的部分之一。這個社群不會因為身份而把人拒之門外,對所有人都持歡迎態度。

大多數公司更需要的是工程師,而不是研究員。現在大部分工作都是基於標準技術,然後應用到特定的業務中。不用搞什麼新研究。

根據我的經驗,一個優秀的教授可以提供很多好主意,讓20多個優秀的工程師忙碌起來。這個搭配是合適的。通常至少需要一個(可能也只需要一個)優秀的教授,以及一個聰明的工程師團隊來支援他。

誰知道如何應用機器學習來解決業務需求?誰定義了模型的輸入和輸出?誰保證了資料的可用性?誰分析了結果?誰解決了問題?

如果是工程師完成了這一切,那就不是一個簡簡單單的工程師。你永遠需要那些能夠洞察業務需求,將其對映到正確的問題和答案上,並轉化為可靠生產程式碼的人。

反對這種分類和對立。許多研究員也很擅長在現實世界中應用這些知識。不過有能力用機器學習來解決問題,和說自己的機器學習專家是完全不同的。

這個爭論很大程度上,源於工程師缺乏必要的認可,導致一些人不得不“假裝”成科學家。不往NIPS、ICML投論文,並不意味著他們不瞭解深度學習的基本原理。誠然,即使進入門檻比較低,仍然沒有足夠的深度學習工程師來滿足需求。

這個領域急需有經驗的機器學習工程師。


AI 行業到底缺什麼樣的人?

Forrester研究公司近日調查顯示,在2018年,科技公司還會為高質量軟體人才漲薪,漲薪幅度高達20%尤其是在需求的技能方面。這些人才包括資料科學家、高階軟體開發人員和資訊保安分析師等。人工智慧相關職位平均年薪達到30萬元-60萬元,特別是有經驗、高質量、對軟體工程有深度理解的工程師,甚至能達到年薪百萬。

那麼,對於希望深入實戰深度學習的同學,七月線上開設了【深度學習集訓營】,略過Python基礎,從TensorFlow搭建DNN解決問題起步,線下一對一指導、互動,實戰BAT工業專案。

4月24日正式開課,線上線下結合(線下在北京和上海)從頭到尾全部實戰,涵蓋特徵工程、深度學習在計算機視覺和自然語言處理領域中的應用,更有大規模車輛圖片檢索等應用於智慧城市、視訊監控等場景的殺手級專案。

640?wx_fmt=png

《深度學習集訓營》課程安排

預習階段 從DL基礎起步,掌握三大核心模型

線上視訊 DNN與CNN,及NN框架

1-DNN與混合網路:google Wide&Deep

2-實戰專案:資料非線性切分+google wide&deep 模型實現分類

3-CNN:從AlexNet到ResNet

4-實戰專案:搭建CNN完成影象分類示例

5-NN框架:caffe, tensorflow與pytorch

6-實戰專案:用幾大框架完成DNN與CNN網路搭建與分類


線上視訊 RNN、LSTM、與條件生成、attention

1-RNN/LSTM/Grid LSTM

2-實戰專案:RNN文字分類

3-RNN條件生成與attention

4-實戰專案:google神經網路翻譯系統


第一階段 從資料科學比賽裡看深度學習應用

線上直播:業務場景下機器學習/深度學習資料處理與特徵工程

1-業務場景下的特徵處理與挖掘套路

2-如何用tensorflow進行常見的資料特徵工程

3-tensorflow搭建baseline模型解決分類問題


線上直播:tensorflow搭建混合網路

1-wide network搭建與優缺點

2-deep neural Network搭建與優缺點

3-混合網路搭建套路

4-用混合網路解決分類問題


線下實戰:從DNN/Wide/Wide&Deep解決房價預測問題

1-機器學習vs深度學習,工業界的利弊權衡

2-神經網路基本原理和訓練要點

3-如何針對不同的應用場景選擇模型結構

4-從wide&deep到混合網路的搭建與應用

5-以kaggle比賽為例講解神經網路解決方案


第二階段 深度學習在計算機視覺中的應用

線上直播:深度卷積神經網路原理與實踐

1-卷積操作的數學定義和物理意義

2-卷積神經網路結構的兩大原理—區域性連線和權值共享

3-卷積神經網路的主體結構和變種


線上直播:海量影象與tensorflow處理

1-Tensorflow輸入資料——TFRecord與Dataset

2-Tensorflow影象預處理

3-Parameter Server原理

4-Tensorflow的分散式訓練的實現


線下實戰:影象分類與影象檢索實戰

1-靈活選取卷積神經網路結構作為影象分類的Backbone

2-遷移學習在深度學習中的應用——“微調”(Fine-tune)技術

3-影象搜尋的前世(Bag-of-Visual-Words)和今生(Deep Learning)


第三階段 深度學習在自然語言處理中的應用

線上直播:文字預處理,詞袋模型,word2vec,語言模型

1-NLP基本知識:詞袋、tf-idf、樸素貝葉斯

2-DL中的NLP基礎:word2vec、doc2vec、embedding、N-gram LM

3-用深度學習一步步完成情感分析任務


線上直播:CNN/LSTM 文字分類

1-文字分類問題處理流程

2-傳統模型在文字分類上的表現

3-從RNN到LSTM

4-CNN/LSTM 在文字分類上的應用


線下實戰:文字語義相似度匹配模型以及Seq2Seq模型構建

1-深度學習在自然語言處理中的基礎工具:word2vec、Embedding

2-文字檢索與匹配通用模型方法:DSSM,CDSSM,DRMM,ARC-I

3-Seq2Seq模型搭建詳解與應用案例

4-(短)文字語義相似度匹配模型構建及其實踐應用


線下實戰:影象生成文字(Image2text)

1-Image2text基本模型

2-基於Attention的Image2Text

3-反問題:Text2Image


第四階段 高階深度學習應用場景

北京線下:基於深度學習的聊天機器人,看圖說話與VQA

1-基於深度學習匹配的聊天機器人

2-基於序列到序列模型的聊天機器人

3-結合CNN與RNN的看圖說話與VQA看圖問答機器人


上海線下:大規模車輛圖片搜尋(Re-ID)演算法原理及實踐

1-多工(Multi-task)深度學習模型搭建與訓練

2-深度排序(Deep Ranking, Triplet Loss)原理與訓練技巧

3-使用多工和深度排序模型,構建一個工業界和學術界最前沿的大規模車輛圖片搜尋演算法(可用於智慧城市、視訊監控等安防場景),在業界最大的車輛搜尋開源資料集上取得State-of-the-Art效果


第五階段 深度學習模型優化及實踐技巧

北京線下:NLP與CV資料科學比賽案例詳解與實踐

1-NLP AI比賽:文字主題與標籤預測(通用模型結構、textCNN與textRNN、texRCNN與其他網路)

2-影象比賽基本套路

3-影象分類與影象分割比賽解決方案介紹


上海線下:深度學習模型優化前瞻技術 以及實踐技巧

1-深度卷積神經網路的歷史變革和設計理念——從AlexNet到DenseNet

2-解析各類輕量級深度網路的設計理念——深度可分離網路

3-深度學習模型訓練時應注意的問題即實踐技巧

掃描下方二維碼加入課程

640?wx_fmt=png

相關文章