未來3到5年內,哪個方向機器學習人才最稀缺?

視覺計算發表於2020-06-18

1.png

未來 3 到 5 年內,哪個方向的機器學習人才最緊缺?今天我們就來梳理一下。全棧式工程師在初創公司受歡迎,領域專精的演算法人才在大公司很吃香,應用型人才能夠快速提升業務,而工程化是落地的重要一環。

AI 專業畢業後好找工作嗎?

此前,知乎上一位 CV 專業的 985 高校研究生曾坦言,當初選擇該方向時,深度學習正處於大熱階段,無人駕駛,人臉識別聽起來就很高大上,似乎人人都想往這方向轉。

然而,到了找工作的時候,這哥們發現就業形式和他想的相差太大:

最近陸陸續續有公司開始秋招的提前批了,計算機視覺崗位招的清一色演算法工程師,沒有論文,或者大賽獲獎的找到演算法崗的簡直不要太難,周圍的同學都開始紛紛轉 Java 開發,自己也開始慌了。

想到學了兩年的 CV,最後工作找不到,一時間十分失落,感覺如果去做 Java 開發,還不如本科一畢業就出去工作,完全沒有讀研的必要。

那麼,機器學習大規模發展是不是隻是個幻覺?未來 3 到 5 年內,哪個方向的機器學習人才最緊缺?

這可能是每個正在學習這個專業的人,最為關心的。每人每天至少產生 1G 以上的資料,還有大量的資料尚未加以利用。每一個垂直細分的應用場景,都可以透過機器學習產生應用價值。這也就意味著相關領域的人才大量的稀缺。

總結起來,主要有以下幾個方面的人才最為稀缺。

靈活解決問題的全棧工程師

全棧工程師是指掌握多種技能,勝任前端與後端,能利用多種技能獨立完成產品的人。

中科院大學,計算機應用技術博士王晉東表示,全棧式的人才最為稀缺,現在很多搞模型的,或者偏重某一方面的,距離解決實際問題是遠遠不夠的。

image.png

而人工智慧全棧工程師比通常意義的全棧工程師更復雜一些,難度也更大,主要是演算法實現跟傳統的全棧區別很大,從應用層級來講,分計算機視覺、自然語言處理、語音識別三個大方向。

細分的話就更多了, 計算機視覺方向來說又可細分為目標檢測、姿態估計、人臉識別等,所以要做人工智慧全棧需要投入更多的精力,也需要對各個方向的演算法有深刻理解。

image.png

人工智慧全棧通常是基於大廠的雲平臺進行開發,人工智慧領域很多基礎的元件已經封裝好,對業務和整個專案的架構有了全面瞭解,就可以上手開發了,需要結合業務快速變現的場景,對「全棧」的需求會多一些,在普遍繁榮時期是可以大有作為的。

但人工智慧全棧工程師發展如何,還要看整個行業大形勢,如果各個方向都開始優勝略汰,「全棧」是缺乏核心競爭力的,因為演算法是別人的。

專精一個領域的演算法人才

有知友提到, 專精一個領域的演算法人才會比較吃香。

image.png

這裡演算法人才包括 演算法研究員演算法工程師

演算法研究員致力於解決更通用,更抽象的問題,如何解決 GAN 訓練時的穩定性等,而演算法工程師更多關注如何解決問題,比如某個場景下出現了 badcase,我就想辦法解決問題,是資料預處理,還是引數需要調整。

image.png

此外能快速復現論文結果的演算法研究員也是各大公司爭搶的香餑餑。因為學術界很多新成果只有一個描述,並沒有給出原始碼,想應用它的研究成果,需要自己實現,所以能快速復現論文的演算法研究員對公司來說也是很有價值。

我們去招聘網站搜演算法崗,可以大體看出資深演算法專家薪資上限很高,但是崗位需求並沒有演算法工程師多,畢竟企業還是要賺錢的,所以演算法工程師(尤其是推薦方向)也很有市場。

image.png

研究員覺得工程師的活沒技術含量,工程師可能會覺得你天天整些虛的又解決不了問題,紙上談兵。演算法作為一個公司的核心資源,兩者其實都有發揮的空間,跟公司的業務需求關係很大。

做演算法研究也好,工程也好,選對方向很重要,單從行業飽和度來說,影像也就是視覺方向確實人滿為患了,語音又特別難,而且缺乏大量的可用資料,自然語言處理方向倒是可以考慮一下。

一來各種 SOTA 模型大多針對英語的,到中文有個遷移問題,二來中文跟英文在文法、語義方面存在差異,有很多空白研究領域。

知乎答主紫杉舉了一個例子,什麼是精通一個領域。

他的一個名叫伊森的同學,從伊利諾伊香檳畢業(計算機專業名校),讀了兩年計算機研究生,是一位非常優秀,有自學能力的學生。

結果面試時伊森沒能應聘成功。伊森的背景和很多進入人工智慧領域的人很相似。答主分享了下面一段對話:

image.png

最後伊森還問他,如何在一週內精通自然語言處理,然後答主只能告訴他不知道。

這個例子表明,有些同學擅長快速學習,卻很容易陷入每一個領域都想學的陷阱,到頭來覺得學了很多,實際遇到問題就無從著手,或者浪費很長時間尋找問題根源。

如何才算精通一個領域?說自己精通某一領域,在人工智慧領域往往是不太恰當的。現在無論是硬體還是演算法都在快速的迭代,今天的SOTA明天可能就成兜底了,只有不斷迭代自己的知識,才能跟上業務和場景的發展,讓自己不落下風。

熟悉業務又懂演算法的應用型選手

另外,既懂演算法,又有某一行業的豐富經驗也很重要。機器學習雖然是通用技術,工程師也基本是計算機出身,但落地需要具體到行業應用,如何結合行業實操,解決實際問題。

中國科學院大學研究員表示,短期內最缺的肯定是 應用型人才

image.png

很多行業想轉型為資料驅動或者 AI 賦能的,藉助於外包或者諮詢公司通常很難成功,因為缺乏行業經驗,這時從傳統行業轉型到人工智慧的應用型人才就至關重要了,他們對機器學習的研究本身就植根於業務需求,所以更接地氣,落地也更快。

中科大研究員舉了一個很生動的例子。

很多高校的財務人員,每天大量重複性勞動,處理發票、報銷單,將紙質單號手動輸入電子系統裡,過程非常的麻煩。但其實高校及科研單位研究計算機視覺、文字識別、目標檢測的團隊枚不勝數,為什麼不能用機器學習的方法來節省時間呢?

這個例子就暴露了一個問題,大多數機器學習研究關注的是模型本身,是否是業界最先進的(SOTA),卻忽視了演算法的適用物件以及實際的應用場景。因此,最稀缺的是既懂演算法又能將演算法進行落地轉化的人。

答主微調丟擲金句「對於絕大部分人而言,努力成為交叉領域的熟手,比成為電腦科學家要現實且有意義。」

image.png

學術模型工程化人才

演算法要落地為產品,還需要 模型的工程化,如果這塊能夠深入,那麼必然是不可多得的人才。

像抖音的推薦系統,如何解決海量資料擁堵,移動端最佳化等工程上有非常多的挑戰。

結合上文答主紫杉舉的例子。

Nihil (尼希爾)是另一個他認識的研究生,也是從伊利諾伊香檳大學畢業。他之前在 LinkedIn(領英)做大規模搜尋(Scaled Search),專門負責把理論演算法擴大到工業場景中,擅長搭建後臺,有很強的工程背景。兩年的史丹佛計算機碩士後,現在被 Snapchat 找去做大規模影片搜尋演算法。

相比於上文的伊森,他是公司更想要的人才。為什麼呢?

因為他在領英和 Snapchat 這樣的大公司做大規模搜尋的演算法,這其中的工程難度和實驗室是不可同日而語的。

任何人都可以跑一個 LSTM,但是當訓練資料極具擴張時,LSTM 需要跑 3 天才能見完所有的資料,在這個情況下,就需要更工程化的實現,做分散式計算或者最佳化演算法本身的效率,使用更快的資料結構等。

這樣的場景就需要有研究背景的人才,能夠結合學術前沿切實的解決工業上的難題,深度學習 50% 是學術, 50% 是工程。現特斯拉 AI 主管 Andrej Karpathy 主要就是幹這活的。

此外,很多人提到調參工程師。

一位中國科學院大學計算機應用技術博士表示, AutoML 越來越受重視,技術含量不高的調參工程師未來很可能被取代。

image.png

最後值得一提的是像 Bengio、 Hinton 這些深度學習領域的神級人物,當然是很需要,但是這類人才真的是可望而不可及。

文章來源: https://developer.aliyun.com/article/765332?groupCode=aliyunmit


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956605/viewspace-2699147/,如需轉載,請註明出處,否則將追究法律責任。

相關文章