AI 社群有多排外?「外行人」觀點引發爭議

機器之心發表於2018-08-30

人工智慧近年來發展迅猛,也引起了很多其它領域研究者的關注。越來越多有關 AI+傳統領域的研究正出現在 Nature、Cell 等重要期刊上。然而隔行如隔山,對於其它行業的人們來說,AI 研究社群似乎並不如看起來那麼友好。

近日,蒙特利爾 Jewish General Hospital 的生物統計學家 Alexia Jolicoeur-Martineau 在社交網路中抱怨 AI 研究社群排外,吐槽 Yoshua Bengio 的言論引起了業內人士的注意。AI 領域的學者 Ian Goodfellow 等人紛紛表示關注。眾所周知,人工智慧領域能有今天的發展離不開開源、arXiv 分享精神的幫助,但這次討論給了我們從另外一個角度看待問題的機會。

值得一提的是,在成為醫療行業的科學家之前,Alexia 自己有電腦科學和統計學背景(她有數學和計算機學士學位,以及統計碩士學位)。

AI 社群有多排外?「外行人」觀點引發爭議

Alexia Jolicoeur-Martineau 的 Twitter 內容如下:

我們需要討論一下這一問題。我把其他 AI 研究者(有的來自蒙特利爾,有的不是)也拉入了討論,因為我認為這個問題非常重要。

這個問題不止關乎蒙特利爾,還關乎整個 AI 生態。

除了詬病一些小的溝通問題,人們總是在讚美這個社群的偉大,但沒有人注意到這個社群有多麼封閉、排外。

在小組討論中,我只聽 Yoshua Bengio 提過一次「NGO」(非政府機構),學界和業界是最常出現的兩個字眼,好像這個社群非此即彼。事實並非如此,NGO 是存在的,裡面是一些因為不堪忍受學術界虐待/盤剝而出走的人。

或者僅僅是因為他們無法解決政治和環境問題(此類文章比比皆是)。因此,許多人像我一樣屢次嘗試申請讀博,但還是被拒之門外。

如果其他像我一樣有 10 篇統計學方面的論文(8 篇已發,其中兩篇是第一作者)和 2 篇 AI 方向論文(未發表)的人也屢次遭拒,那麼這說明一個問題:一大批才華橫溢的人才被攔在這個社群之外。

如果絕口不提這些人,也不考慮將其納入討論小組,那麼我們相當於假裝他們並不存在。有人提到了這一漏洞百出的流程,說想要申請讀博非常困難,Joelle Pineau 的答覆是這一問題將盡快得到解決。

Pineau 提到了另外的 20-40 個博士點。很抱歉這並不是問題的解決之道。她還提到有 300 人申請他們的 GAN 研究專案,她說,申請者或許應該轉向其它更有趣的專案。

這表明她不會再接收 GAN 方向的申請者。這點合情合理,因為決定接收誰做自己的學生是她的權利,但這表明這一領域門檻很高,僅僅增加幾個名額並不能解決問題。

在這 300 個對 GAN 感興趣的申請者之中,可能有 50 個天分極高的人才不得不停止該方面的研究,轉而投向其它不相關的崗位或產業。

我們失去了那麼多樂意在學界之外進行科研(不計報酬)的人才。但在研討小組中我們連他們的存在都沒有提到,這更加重了 AI 社群生態的封閉、排外感。我們至少應該承認這一點!

我堅信,以後有了基本收入之後,這些研究人員即使不在學術界也會做研究;同時,還有很多 AI 的業餘愛好者在空閒時間進行 AI 方面的研究,我們不應該因為這些人沒有華麗的頭銜而忽視他們。

我的建議是,在學界之外建立一些儘可能國際化的 AI 實驗室,裡面沒有論資排輩,任何人都能提出專案,並/或成為一名 PI(不需要任何華麗的頭銜)。如果大家對這個主意感興趣,我很樂意繼續展開。

我沒有足夠的資金啟動這樣一個艱鉅的專案,但我堅信這才是未來,我們需要停止維持這個社群一切都好的假象,不再假裝那些學界、業界之外的人不存在,或拒絕承認他們是「真正的研究者」(雖然沒在討論小組中聽到過,但之前聽到很多人這麼說)。

AI 社群有多排外?「外行人」觀點引發爭議

Alexia 希望申請 GAN 方向的博士遇阻,她的遭遇引起了 GAN 發明者 Ian Goodfellow 的關注:

來自一家醫院的生物統計學家正在抱怨融入 AI 研究社群的困難,她既不屬於人工智慧學界,也不屬於工業界。

其他人或許就沒有這麼冷靜了,Alexia 的觀點在 Reddit 上引發了熱烈的討論,其中不乏對於機器學習界長篇大論的辯護。

BeatLeJuce 對此表示:

就我所知,機器學習是一個最為開放、包容的研究社群之一——但現在人們都被慣壞了,因而忽略了這一點。明確點說:幾十年來,人工智慧社群一直在努力,所以我們的研究成果對每個人都是可望又可及的。現在我們的大部分研究都在 arxiv 上免費分享,大部分程式碼也都在 GitHub 上分享。ICLR 是第一批試圖通過建立 openreview.net 來公開進行審查的大會之一。

我們大部分書也是免費的,比如 Goodfellow、Mackay 和 Tibshirani 等人的書。第一批成功的 MOOC 是由機器學習者開設的,第一批高影響力的 MOOC 平臺也是由機器學習者建立的:吳恩達和 Koller 創辦了 Coursera,Thrun 創辦了 Udacity。你甚至可以在推特上給世界一流的研究人員發訊息,並與之展開這樣的討論。所以,我認為機器學習站在了無障礙研究的前沿。

我們並沒有故意去孤立任何人,也沒有把任何參加科學領域活動的人排除在外。有人抱怨過因為沒有博士學位而不得參與高能物理研究社群嗎?或者計算機架構社群嗎?又或者其它任何研究領域嗎?如果你想寫一篇關於量子化學的論文,直接寫就好,沒人會阻止你。但如果你想參與該研究領域的討論,你得讓其他量子化學家相信你的研究有價值。就這麼簡單,機器學習同樣如此。

對此,唯一的問題是:1)ML 非常火熱非常潮,每個人都想加入;2)在 ML 中,我們總是盡己所能地讓所有材料和資訊對其他人開放,所以人們以為入學門檻很低,即使沒受過正規教育,他們也能實現這些。但事實是,大多數時候,人們確實缺少正規教育,因為有很多技能 MOOC 還沒有傳授:如何寫好 ML 論文,如何區分質量高的論文和不怎麼樣的論文。

理論上來說,你當然可以參與 AI 研究,即寫自己的論文。而如果它被拒收了,那說明有 3 個人看過並且都認為它不夠好。這很可能意味著這個想法或者研究方案不符合標準。的確,也許 5 或 10 年前,如果你在 CIFAR 或 MNIST 取得了好成績,一次沒有理論依據的簡單黑客攻擊可能會給你帶來一篇不錯的論文。但現在不會了,因為這個領域已經成長了。所以,如果你讀了舊論文並認為「我本來可以這麼做」,那你可能是對的。但要記住,情況已經大不一樣了,這些論文中的大部分現在已沒法實現。

論文評審會要求清晰的解釋、誤差條和理論依據等等,因為我們要弄清楚什麼是真正有效的,以及為什麼有效。我們不是想刻薄,而是想徹底弄清楚。我們是科學界,這是我們的工作。雖然你不一定非得有博士學位才能成為科學家,但有個博士學位確實有用。即使有些科學家沒有博士學位,但請你明白!這些人是非常特殊的存在,在整個社群裡佔很小的比例。以 C. Olah 和 Dyson 為例子的人可以滾蛋了,因為這些人顯然不明白這二者是怎樣特別的存在。對於普通人來說,規則很簡單,且相當直接:如果你想成為科學家,那就接受對科學家的培訓——取得博士學位。

我知道,有些人抱怨說博士學位很難獲得,我也聽到了這樣的聲音。這個領域現在非常流行和熱門,所有一些有名氣的人會被博士申請洪流給淹沒。你聽得沒錯,洪流!所以,有時候進入一個好的研究所沒那麼容易,因為我們既沒有時間也沒有資源來接受所有申請人。這意味著,有些人即使有實力,也可能不會被接受。這很糟糕,但對此我沒有任何解決辦法。

但要求我們「更包容」有點牽強。我認為我們已經足夠包容了,而且我在開頭就提到了這一點。我們非常歡迎每一個社群之外的人向任何 ML 會議提交其研究報告。如果你的論文足夠好,你就能夠發表它。如果不是,那請你做得更好。很抱歉,我們沒時間教你如何寫好論文和進行適當的實驗,因為我們已經被學生給淹沒了。

john_8_32_表示:

這種想法太荒謬了,就相當於在說我的申請被拒了,所以整個博士申請系統都很糟糕。我很同情那些申請被拒的人,他們也是一心想成為科學家,但這一領域已經被炒得太熱了,而且研究院名額有限,無法滿足這麼大的需求。學術界確實有太多太多的問題存在,但除了研究院壓力過大使得研究人員精疲力竭之外,我不覺得她指出的問題戳中痛點。

如果其他像我一樣有 10 篇統計學方面的論文(8 篇已發,其中兩篇是第一作者)和 2 篇 AI 方向論文(未發表)的人也屢次遭拒,那麼這說明一個問題:一大批才華橫溢的人才被攔在這個社群之外。

統計學和機器學習是非常不同的領域,有著不同的目標和標準。我看了她的論文,看起來是挺不錯的統計學論文,但論文得以發表在另外一個領域並不能說明她的 ML 論文有多好。一些終身教授的論文也經常被拒。很明顯,同行評審是有瑕疵的,但這種言論是相當奇怪的。同時也給一絲鼓勵:我認為被拒有助於寫出更好的論文,而不是世界末日。

這表明她不會再接收 GAN 方向的申請者。這點合情合理,因為決定接收誰做自己的學生是她的權利,但這表明這一領域門檻很高,僅僅增加幾個名額並不能解決問題。

確實,在資源有限的世界,即研究所裡,「門檻」對於資源分配是有必要的。

我的建議是,在學界之外建立一些儘可能國際化的 AI 實驗室,裡面沒有論資排輩,任何人都能提出專案,並/或成為一名 PI(不需要任何華麗的頭銜)。如果大家對這個主意感興趣,我很樂意繼續展開。

我沒有足夠的資金啟動這樣一個艱鉅的專案,但我堅信這才是未來,我們需要停止維持這個社群一切都好的假象,不再假裝那些學界、業界之外的人不存在,或拒絕承認他們是「真正的研究者」(雖然沒在討論小組中聽到過,但之前聽到很多人這麼說)。

處於學術界和工業界之外的人們的研究成果基本上沒有發表。科學是讓人們分享知識的社群,如果不能讀到你的論文,沒有人會感受到你的影響力。從科學的角度來說,你或多或少是不存在的。這點說起來很令人難過,但這就是我們積累知識的方式。

Alexia 的遭遇並不是罕見的例子,同樣投身醫療領域的 noelsusman 表示:

我是一名肄業博士生(提前退學了,目前擁有碩士學位),現在在一所醫院研究機器學習

我認為學術界已經遭到破壞,但不是因為原貼中提到的任何一個因素。從醫療界的角度來看,我們是有太多(而不是太少)的人在做研究。作為一個群體,我們並沒有好好利用那群湧入到 GAN 研究的人們的成果。

我所在的這家醫院仍然在使用簡單的啟發式方法來評估再入院風險。我們目前所處的階段,只要擬合一個 logistic 迴歸到一些基礎的診斷資料就能顯著改善原來的狀況。但這並沒有發生,因為我們有太多這樣的問題需要解決,卻沒有足夠的人手。這是個很困難的問題,因為(a)醫院沒有用不完的資金;(b)我們的人力資源不足,因為薪資水平競爭不過技術公司。在街對面就有這樣一家公司,我能在那裡做相同的事情並拿到多 20% 的薪水。

我確實希望有更簡單的方式讓外行人進入學術界。我現在在做的研究是新穎的、可發表的,並且我也樂意分享,但我不知道如何解決更大的問題。

AI 社群有多排外?「外行人」觀點引發爭議


人工智慧現在已經成為熱門學科,即使對於 AI 領域之內的人來說,2019 年申請博士學位的難度也已大幅超過往日。相信隨著人工智慧的發展,這樣的討論還會愈演愈烈。

相關文章