表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

AIBigbull2050發表於2020-09-04
020-09-02 17:41:15

賈浩楠 發自 凹非寺
量子位 報導 | 公眾號 QbitAI

機器學習工程師崗位,還香嗎?

在培訓機構或求職網站隨便一搜,機器學習簡直不要更熱。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

但是,國外的同行們卻在一則Reddit熱帖上,吐槽揭露ML工程師“表面光鮮,實際搬磚”的一面。

說出了培訓機構不會告訴你的機器學習業內真相。

那這些“過來人”怎麼掉進一個個暗坑的?他們的經歷對你有什麼警醒借鑑的意義呢?

機器學習崗,怎樣避免淪為資料標註師

Reddit熱帖下,網友們吐槽最多的,就是學習和工作的巨大差距產生的 幻滅感

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

學了一大堆牛X高大上的理論知識,以為自己能上手酷炫的神經網路,調參、訓練、部署一條龍,但實際上,這些內容大概只佔全部工作的10%-20%。

而且在一些團隊中,會有專門的崗位來負責這些工作。

其餘大部分人的職責是收集資料、給資料打標籤、處理資料質量,或者用Python寫基礎架構。

當年夢中的那個引領AI潮流的少年,就這樣成了資料標註師。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

但是,網友也承認這一點確實是業內的普遍現象。而且,剛剛工作的新手,從低層技術開始做起,也是符合常理的。

大家的建議是:面對這種大量重複勞動,先別急著上手,去查一查資料,很多類似工作已經有成熟快速的方法。

當你跨過了基礎工作這一關,要面對的,是ML專案中可能出現的各種令人頭疼的問題,而這,是考驗你能否成為優秀機器學習工程師的重要挑戰。

機器學習之路佈滿荊棘

哪些在工作崗位上很重要的東西,是機器學習教程不會教你的?

網友們總結了最重要的4條:

正確認識業務
處理凌亂的現實世界資料集
工程導向,而不是在Jupyter Notebooks中編寫研究程式碼
視覺化

這些都是網友們在工作經歷中吃了很多虧後,總結出的經驗。

比如,很多ML工程師 只有給定一個抽象化的問題才能上手,缺乏應對實際工程問題的能力。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

而一個合格的、被業內廣範認可的機器學習工程師,他可能並不精通演算法的數學原理,而是能夠在約束條件眾多的實際情況下應用演算法解決問題。

比如,在很多情況下,普通的舊演算法(例如K-Means,高斯混合的EM等)非常有用。 燒GPU並不是唯一辦法

避免紙上談兵,這是機器學習演算法工程師正確認識業務的一部分,除此之外,重要的點還有 合理的工期規劃,和 良好的溝通能力。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

規劃傳統工程專案時,設定里程碑、期望值、是(相對)簡單的。

但對於機器學習專案來說,在最初目標和前期階段之後,很難給出具體的計劃,因為變數實在太多了。

這就需要在專案初期階段就保持頭腦清醒,不要給自己挖坑,同時也要和boss以及同事說明溝通。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

一位網友談到了切身體會。他放棄了機器學習演算法崗位,原因是老闆根本不關心他為了完善演算法細節付出了多少艱苦的勞動,只看最後的視覺化效果。

當boss發現視覺化效果並不高階時,認為他一直在浪費時間沒好好工作。

所以, 比其他軟體工程師更強的抗錯能力,也是你必備的。

如果你能抗過以上所有挫折和困難,還有艱難的一關要過。

機器學習業內的謊言

任何人都可以輕鬆成為資料科學家/機器學習工程師
軟體工程師可以輕鬆成為資料科學家。
學習應用“現成庫”就可以輕鬆上手搞AI。
搞AI無需學習高等數學/統計學
一種特定演算法可以應用於任何領域並獲得成功

這些,就是Reddit網友當年少不更事是信過“鬼話”、踩過的坑。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

那麼,真下決心走機器學習這條路,應該相信什麼呢?

首先是要對行業現狀有大致瞭解。

對於普通開發來說,機器學習崗位數量要比其他開發崗少很多。網友反映,在北美地區,100-150個後端開發的公司可能只有有2-5個搞AI的人。

其次,是很多有AI需求的公司沒有必要的GPU等基礎設施,你去了才發現只能使用免費的Collab。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

從個人求職角度講,ML專案大多很比較專,比較小眾。你之前的專案經驗,全國可能只有不多的幾家公司感興趣。

明白了這些,你還要清楚怎樣正確地踏入機器學習的門。

多數有AI需求的公司,要求的是後端+DevOps+AI+前端這樣的一體化崗位。這就需要你的全棧能力。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

編寫,測試,部署,在生產中跟蹤模型、構建大規模資料是一個競爭力出眾的機器學習工程師必備的。

而這些能力的基礎要求,就是數學。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

你當然不需要像搞科研那樣精通數學。但紮實的 高數、機率論、統計學基礎必不可少。

對於有些培訓課程打出的所謂不要求任何基礎就上手AI的,Reddit網友直接說:“沒有數學基礎和過往程式設計經驗的人,寫出的程式碼是十分 可怕的。”

大牛不僅僅止步於機器學習

當然,數學基礎再好,程式碼寫得再漂亮,也只是一個優秀的機器學習工程師。

真正的大佬,是不會止步於此的。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

一位現在在搞神經科學的網友給出了獨到的建議:

如果想做真正創新,有趣的工作,那麼僅憑機器學習知識是不夠的。還需要其他專業知識。

表面光鮮,實則搬磚,機器學習社群自嘲不為人知的AI工程師真相

在特定環境中,清楚需要用那種ML演算法來結解決問題,並且能高效處理資料,這樣才能讓你做出行業內獨樹一幟的先進成果。

以上就是Reddit機器學習社群的“過來人”給大家的忠告。


— 完 —

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2717139/,如需轉載,請註明出處,否則將追究法律責任。

相關文章