邁克爾 · 喬丹:我討厭將機器學習稱為AI

AI科技大本營發表於2018-03-24

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


編譯 | 人工智慧頭條(公眾號ID:AI_Thinker)

參與 | reason_W


上月,由 Michael I.Jordan 、Jeff Dean、李飛飛、LeCun 等多位人工智慧領域的大牛發起的系統機器學習會議 SysML 在史丹佛開幕。


會上,機器學習宗師級大牛 Michael I.Jordan 就《系統與機器學習的前景與挑戰》進行了主旨演講。因為和 NBA 球星邁克爾·喬丹名字相近,他有著一個有趣的稱號:“The Michael Jordan of Machine Learning”,機器學習界的邁克爾·喬丹


為什麼說他是機器學習宗師級大牛?要知道,在這一領域的重要學者如吳恩達,Zoubin Ghahramani, Tommi Jaakkola,  Lawrence Saul 和 David Blei 都是他的學生。他現在擔任加州大學伯克利分校電機工程與計算機系和統計學系教授。


Michael I.Jordan的重要貢獻則包括指出了機器學習與統計學之間的聯絡,並推動機器學習界廣泛認識到貝葉斯網路的重要性。他還以近似推斷變分方法的形式化、最大期望演算法在機器學習的普及方面的工作而知名


此次演講中,從一開始他就現在所謂的“AI”進行了抨擊。他認為,現在媒體上熱炒的“AI”概念言過其實,很多人都是為了藉此向 VC、媒體以及大眾兜售概念。至於真正的 AI,“我們根本還沒有實現”。也有相當一部分研究者陷入了深度學習的泥潭,思維變得更加狹窄。


他回顧了機器學習領域的現狀,以及今後發展面臨的挑戰。雖然機器學習理論目前的發展達到了一定高度,但他很討厭人們現在突然將它稱為 AI,因為那仍然還只是機器學習。他認為真正 AI 的實現,需要依靠邏輯、推理、決策等運算的突破才能實現,但現在它們之間還存在明顯脫節


一些經典 AI 領域,如計算機視覺、NLP 等還遠未達到智慧和實用的地步,有賴進一步研究和努力。與此同時,傳統的社交平臺,如 Facebook,還遠沒有真正地將人們連線起來。醫療、金融、音樂、餐飲等眾多系統平臺仍存在巨大的想象空間,要做到這些,需要研究者們跳出傳統視角。


本文為 Michael I.Jordan 在大會上的演講實錄(有刪節),人工智慧頭條整理。


640?wx_fmt=png


 我們還沒有實現真正的 AI


你們知道,我之前從 MIT(麻省理工)離職去了 UC 伯克利。這其實是因為 MIT 沒有任何跟統計相關的專業,並且直到現在也還不算有,而我認為統計學對電腦科學至關重要。雖然今天電腦科學的發展已經十分激動人心,但它依然還沒有解決推理性的問題,在計算機和推理之間有一個脫節,所以我才要跳槽去研究概率和統計。


很多人說我這些做法是在從統計視角在研究 AI,這種看法欠妥,我只是在研究機器學習。AI 是一個非常寬泛的概念,它幾乎涉及到所有層面的電腦科學。它的每一部分都應該涉及到資料流,並且應該基於這些資料自適應地進化。這裡面全是電腦科學,但直到今天,這一看法也還沒有在計算機系得到很多認同,他們仍然認為統計是 AI 的一部分。


我已經疲於應對這些爭論了。


今天,我們到處都可以看到“AI”這一字眼,媒體上鋪天蓋地。這讓我感到非常不安,因為那些說法太言過其實了。我們沒有實現人工智慧,沒有實現智慧,甚至連它們是什麼都不知道。我們說現在的系統都涉及到資料的輸入輸出,它們其實是在模仿一些很聰明的東西,但也僅僅是模仿,根本稱不上是智慧,我們並沒有實現它。


今天,很多人樂衷於使用“AI”這個流行詞。但這只不過是他們藉此向 VC(風險投資)、企業、媒體以及大眾兜售一些他們自己的概念。至於真正的 AI,我們根本還沒有實現。我現在雖然不再跳出來爭論這些話的對錯,但依然會在內心時時刻刻提醒自己:我們還並沒有實現所謂的 AI。


現在,我非常高興我們有了一個這樣的社群,我們當前真正需要的正是建設性的努力,那必須保持嚴肅和清醒。並不是所有的炒作都是在為了在 AI 淘金熱中大賺一筆,他們或許也是為了能夠真正實現 AI,讓這個世界變得越來越美好,讓 AI 更加穩定,更加真實,足夠支撐建立一個全新科學領域所需的概念。


這就像有人喜歡土木工程、喜歡化工工程師一樣,我也非常尊敬他們在所在領域做出的實實在在的努力。他們研究出的東西切實改變了每個人的生活,而這也正是 AI 領域所需要的和依然欠缺的。


機器學習領域的現狀


640?wx_fmt=png

機器學習理論已經發展到了目前我們所看到的高度,我在二十年前我就已經預見到它的發展會是這樣:資料將無處不在,用機器學習進行決策和商業建模將成為我們的習慣。但我很討厭人們現在突然將它稱為 AI,雖然最近有一些新的想法出現,但那仍然還只是機器學習。我不和他們爭論,並不代表認可他們的說法。相反,我會更加堅持自己的追求。


這世上並沒有魔法,機器學習只是將它的輸入輸出對映到它對一些處理機制的模仿之上了,雖然這看起來很神奇,但其實依然還有很多真正的問題——比如從廣義上來說,很多層面上的系統問題——都還沒有得到解決。


機器學習也還遠遠沒有發展到足以成為一個可靠的工程原則,可以針對現代資料分析問題得到魯棒的、可擴充套件的解決方案。有很多涉及到不確定性、推理、決策、魯棒性和規模化的問題都還沒有得到解決。更不要說經濟學系統了,因為我們甚至對建立系統時的定價和激勵行為也還沒有足夠的思考。社會法律系統也是如此。


我以為每個人都會或多或少意識到這一點,但沒想到等待他們意識到這一點需要的時間卻長得不可思議。


祖克伯在一年前的演講中曾談到他建立 Facebook 時的經歷,“我什麼都不知道,在這一過程中也並沒有扮演任何角色。我們只是搭建了一個平臺,而關於如何使用它甚至都沒有規定。但後來讓我感到震驚的是,人們並沒有很好地使用它”。


我們不僅要時刻注意人們有沒有用這個平臺來做壞事——比如虛假新聞,還要讓人們可以通過這個平臺得到正確結果,否則每天都會有數十萬人因此做出錯誤的醫療決定、糟糕的交通狀況或者財務決策。到目前為止,我們甚至都還沒有在解決這些問題上取得一點進步。我們的反應就好像在說我們本來就是如此。


對我來說,系統機器學習瞄準的目標太低了。這個社群中的很多人炒作深度學習太過頭了,我們已經有了反向傳播(Backpropagation)這個偉大的學習機器;我們要讓它可以更好、更快、更容易實現,所有這些都會很快實現;公司也會成立,經濟也會向前發展。但這樣做的目標定得太低了,這僅僅是一個非引數迴歸問題,甚至都談不上“是”。所以我希望作為一個社群,我們可以有更高的目標,我們不能僅僅努力讓反向傳播更容易。


 “AI” = IA + II


下面我來談一下為什麼我說在人們的腦海裡計算機和推理沒有連線起來。


640?wx_fmt=png

其實在我一開始接觸這個領域的時候,我當時學習了一些關於 AI 的東西,但我沒有真正研究過。那時候有很多研究 AI 的觀點,比如通過廣度優先搜尋來尋找一個明星,這也是約翰·麥卡錫(John McCarthy)真正在 MIT 在做的研究。(注:約翰麥卡錫,人工智慧領域的開山鼻祖之一,他曾發起和參與 AI 歷史上著名的達特茅斯會議,後來前往史丹佛並組建了史丹佛人工智慧實驗室。)


我要說的這個故事和你們往常聽的有點不同:人工智慧這個概念並不是 Minsky、McCarthy、Newell 他們那些人坐在一起開了個會就討論出來的。


麥卡錫剛到 MIT 的時候就說過他會研究智慧(Intelligence)和計算領域。他們說那並不是控制論,控制論已經有維納在做了,麥卡錫解釋了這兩個領域的區別。真正讓人們意識到 AI 是一個新領域的是,這個領域更多的是基於邏輯而不是控制理論和訊號優化,所以他必須給它一個新的名字,所以他發明了“Artificial Intelligence”這個詞。我覺得這個故事更加真實。


然而,歷史的奇異轉折之處在於現在研究 AI 的所有想法都在維納那一邊,都是關於優化統計的,並且沒有邏輯,但現在大家用的“AI”這個詞卻依然還是麥卡錫發明的那個詞。


無論如何,AI 依然是一個偉大的願景。這是一個在思考應該如何將計算實體與軟硬體結合到一起,並構建能夠捕捉智慧的東西的哲學問題,這很有意思。


我認為這仍然還只是一個學術領域的願景,並不認為它有必要或者已經足夠用於促進社會進步或工業發展。我並不相信我們能夠建立通用智慧,並且它可以解決世界上所有問題的說法。那只是愚蠢的科幻小說裡的東西,並且是既不必要也不足夠的。我們需要把思想從一些真實問題中解放出來。有很多有錢的名人說我們要建立一個通用人工智慧,然後就可以解決世界上的問題,比如癌症。我並不想談論這些東西,但人們總是這樣在說。


640?wx_fmt=png

不管如何,現在有個有趣的觀點,我們並不是要讓所有的事情都變好。與此同時,真正發生的事實也並不是 AI 取得了巨大的成功,而是“IA”(Intelligence Augmentation)取得的巨大成就。


搜尋引擎就是這其中的一個代表,它是一個機器學習系統,不停地獲取資料並隨時間進行改善以做出更好的決策。 像其他很多實際工程系統一樣,那是一個涉及到很多東西的機器學習演算法,但那也意味著很多智慧。比如我不必記住白俄羅斯的首都,但是當我在網上搜尋一下就可以馬上知道。我看起來非常聰明,因為我無所不知。


我也可以在這裡說英語,然後通過安裝同傳系統讓你們聽到漢語。看起來似乎我可以說很多門語言,但其實我並不會說漢語,這是因為電腦增強了我的智慧。很多這種用深度學習實現的東西,我認為它們很有趣,但是——比如你見得很多的風格轉換,人們輸進去一張圖片,然後它會被轉換成另一張很酷的圖片,看起來像梵高的畫一樣,那作為一個玩具會非常有趣。但它真正做的是增強了人們的創造力。


它是一種“增強” ,並不是人們說的智慧。但那已經很有趣了,你甚至可以用它來創作音樂,但直接用它寫交響樂就很傻了,誰會在乎一臺電腦會不會寫交響樂呢,無論那意味著什麼。但它卻可以為下一個貝多芬或者傑出藝術家的誕生提供一個自由創作的環境,那才是真正令人激動的,那就是 IA。


640?wx_fmt=png

還有一些更為重要的東西,我將其稱之為“II”,即“Intelligent Infrastructure”。在我們身邊發生的事正越來越多的體現著這個世界對我們的瞭解。


世界正在被連線起來,比如我只要動動手機,就可以在幾秒鐘之內約到一輛汽車,它可以帶我到達目的地。這個世界正在通過網路變得越來越智慧——只要你在一個大的複雜系統上加上資料,加上人類,那就是物聯網。那是一個萬億美元的經濟市場,並且正在改變人類的生活,改變你對於醫療、金融和日常生活的想象。所有這些都是非常巨大的改變,並且在過去的幾十年確確實實發生了。


這讓我想起了亞馬遜——他們是第一家認真做這件事的公司,並且是在 90 年代,遠在我們炒作這個概念之前。現在有很多公司正在建設物流預測以及欺詐系統,還有推薦系統,這些都是非常棒的事情,但那都是機器學習,不是我所謂的 AI,真正的 AI 將比我們現在看到的更為激動人心。

640?wx_fmt=png

我認為在這裡有一個脫節。如果你以這種經典的方式研究 AI ,你或許會對視覺、語音、自然語言處理還有機器人感興趣,因為你是對這種具體的智慧體感興趣,它們會像我們一樣做出智慧的行動。你想到的所有東西都是和具體智慧體有關,所以你可以根據場景開發演算法,並且將它們轉變成目標、標籤或者語音。那都是很棒的,但那並不能解決我們在建立一個真實世界系統時所遇到的真實問題的十分之一。那只是“IA”或者“II”,而且人們的注意力會被視覺或語音方面的問題所分散。


未曾解決的經典 AI 問題


640?wx_fmt=png

雖然有些經典的 AI 問題看起來已經快要解決了,但我要說,我認為我們實際上還遠沒有解決這些經典的 AI 問題。


在計算機視覺中,我們可以比之前更好的標註目標和場景,但它們並不是真實場景,那隻不過是從網際網路上獲取的包含目標的圖片。如果你使用相同的訓練集進行測試,正確率可以達到 90%,但是在真實的世界中那可能只有 20%。因此,我們只不過是對場景中的物件進行了標註,並沒有真正解決這個問題。而關於場景的意義是什麼?場景中正在發生什麼事?接下來會發生什麼?我們甚至都還不知道。所以人們說計算機視覺技術得到的一些東西非常荒謬。


語音領域和語義領域也是一樣。總的來說,我們生活在一個依靠聽覺的聲音世界中,但在閉上眼睛之後,我們還遠不能單純靠聽聲音來了解周圍世界。因為沒有語義資訊,甚至都沒法開始自然語言處理。


翻譯並不是輸進去一種語言的字串,然後得到另一種你之前已經見過很多次的語言的字串就可以了。我說法語很流暢,你用英語和我交流,我也能理解你說話的意思,我會將你話裡的概念轉換成法語詞彙,而不是將英語字串對映為正確的法語字串。你甚至還可以再通過努力讓它的正確率達到 90%,但那依然是無效的。


視覺技術可以通過有監督標記和一些無監督標記技術來應用,而自然語言就不行。如果不相信,你可以試著讀一下道格拉斯·霍夫施塔特(Douglas Hofstadter)前幾天在美國《大西洋月刊》上的一篇文章。他通過英語、法語、德語和中文四種語言翻譯的比對論證得出一個結果:谷歌翻譯即使應用了人工智慧技術也沒有真正理解語言


語言真的是人類的智慧,包含了對這個世界各種事物的諷刺、隱喻、引用和參考。只有我們真的瞭解這個世界才能搞明白語義,它需要理解人類的社會行為、概念行為,而這些並不能通過標籤資料和很多字串來實現


讓我們繼續回到主題上。剛剛我們討論的是翻譯,現在說一下對話。


對話並不只是一個可以和你不停對話的聊天機器人,雖然那聽起來比較有趣。它實際上是試圖實現一個目標,比如我想訂一個飛往巴黎的航班,這中間涉及到我自己的各種複雜偏好,然後最終可以把我帶到那裡。所以我們必須有一個對話逐漸地將我這個意願通過機器人落實到真實世界的實際行動上,但我們離這一步還很遠。


談到機器人技術,你知道它有很多進步。但我仍然十分懷疑,目前工業界的機器人只能在非常有限的環境中工作。我們雖然已經可以讓機器人和人類進行互動,但我並不認為它在我們的生活環境中工作會沒有問題。


機器學習近期的挑戰


640?wx_fmt=png

現在讓我們接著談論技術。如果你是一個系統機器學習研究人員,並且認為自己的生活將支援深度學習方式——我也認為這非常有用——但這裡還有一大堆其它的甚至稱不上是 AI 的東西。


多重決策(Multiple Decisions),統計學家一直在討論這個話題,但機器學習領域的人卻幾乎不談論這個。你可以構造一個神經網路,它需要輸入一些圖片或者搜尋引擎營銷資訊(SEM),甚至一些資料的歷史資訊來進行決策。它會對不同環境中的不同人員使用相同的神經網路做出成百上千次決策,那完全是個災難。


這些決策有可能是完全錯誤的。比如碰巧在下雨天你要乘坐某個交通工具,每個人可能最後都會乘坐同樣的交通工具,到達相同的街道,這勢必會造成擁擠。相關決策波動會導致最終結果的變化,即使那不滿足獨立同分布假設。


我們現在的系統仍然是假設我們處在一種理想世界中,所以總會有錯誤發現率存在(注:錯誤發現率 FDR( False Discovery Rate)是指錯誤拒絕(拒絕真的(原)假設)的個數佔所有被拒絕原假設個數比例的期望值)。系統應該支援可以有錯誤發現率,而不僅僅是支援神經網路中的邏輯迴歸、決策樹。 如果你的系統不支援,我就不會在我的公司用它。


要有一個這樣能夠創造市場的系統,我認為需要考慮大量的因素。所以我們會將經濟學引入我們的系統,我們需要擁有消費者和生產者雙向的連線,而不是僅僅建立一個可以讓人們上傳資料並從中獲取答案的平臺,而不建立一個實際系統。


在今天,不確定性依然存在。我們在統計學中談論的 Bootstrap、貝葉斯理論、Jackknife(刀切法)以及其他原則都還沒有在電腦科學系統內部建立

它們只是輸入輸出,給出一條 ROC 曲線就好像已經完成了其實本沒有完成的工作。所以要如何將智力結合到其中呢?要怎樣解決他們兩者之間不連貫的事實?這是非常關鍵的問題,我們必須解決這一點,並且必須假設這些問題可以通過電腦科學進行處理。


談到抽象,人類其實非常善於發現抽象。舉個例子,比如我可以發明一個新詞彙“Blecch”,然後說一些關於“Blecch”的事情,你就可以知道和它有關的各種各樣的事。你可以通過抽象進行推理,事實上也正是因為我們可以建立抽象概念,電腦科學才可以發展的這麼好。


我的兒子非常擅長發現類比、隱喻以及那些有趣的東西,這些都會在他的大腦中形成一個新的抽象。但神經網路和那個差的太遠了,神經網路必須要先看到大量的資料,最終才能發現一個新特徵,或者如果有人非要稱其為抽象也可以。


資料溯源(Provenance),這非常重要。實際上我對資料科學非常感興趣。在醫療系統中,有很多誤報(假陽性)導致很多死亡的案例。在我兒子出生的時候,有一些錯誤的成像結果,那是一個誤報。如果我們相信了那條決策路線,就可能會走一個非常危險的程式,甚至殺死胎兒。我認為那也可能發生在你身上,我計算的結果是在過去的幾年中,由於誤報,每天大概有 20 個胎兒會被殺死。


誤報和不好的統計資料無關,而是與錯誤的報告結果有關。在某種情況下進行計算的資料,實際上在相同情形下用於新的成像機器時是不準確的。那聽起來是一個討厭的資料庫問題。但就是那個東西讓模型有時難以發揮作用。


關於長期目標,人類非常善於追求長期目標,比如選擇職業、買房。而我們的機器卻並不具備實現長期目標的能力。不要跟我說強化學習,那也沒有長期目標。


實時效能這一目標,我想那些設計自動駕駛汽車的人應該認識到了它的重要性,而其他人還沒有意識到這正是我們要考慮的關鍵部分。這也不是傳統 AI 的一部分。


如果你是一個真正有雄心的系統人員,這些都會是亟待解決的重大問題,並且大多還是很少受到關注或者正在受關注但還需要一段時間才能解決的問題。


機器學習與市場的創造性


我的一些觀點是基於我的研究和在公司的經歷形成的。今天我將向大家分享兩個觀點。


640?wx_fmt=png


就我實際所做的工作而言,我只是一個理論研究者,所以關於這些神經網路發展的良好勢頭,我都樂於看著它們發生,但當我看到所有人都在扎堆朝著一個方向前進時,我就會尋找其它方向。我現在做的所有工作都是在證明收斂率和隨機性的定理,你要是看過我的主頁就會知道我這些天有多興奮,但我形成這些觀點卻是基於在公司的(實踐)經歷而不是通過證明它們。


United Masters 公司是一個美國音樂人服務平臺,它在 2017 年 11 月宣佈成立。現在音樂人非常多,創作的音樂也非常多,但除了少數幾個掌握權力的人之外,大多數音樂人的第一筆訂單並不會賺錢,音樂創作實際上沒有得到報酬。


發生這種狀況的原因有很多,比如我們處在一個並不景氣的市場,而如果連線生產者和消費者的經濟的話,就會產生很多價值。它不像之前的唱片公司一樣,在生產者和消費者之間有中介存在,那在這種模式下不會有效。所以你必須做些別的什麼,就像 Uber 那樣,或者其他你看到的真實的機會。


United Masters 已經和 Spotify 跟 Youtube 等公司建立了合作關係,並且獲得了所有資料。他們會了解任何藝術家,不僅僅有碧昂絲那樣的世界級歌手,還有成百上千個不太出名的藝術家,然後瞭解有哪些使用者在聽他們的音樂。他們提供給藝術家展示的機會:我知道我不是非常出名,但我知道佛羅里達州有一萬人喜歡定期收聽我。


這種口碑就意味著如果我去那裡舉辦一場音樂會,我就可以賺兩萬五千美元。一年我可以做三到四次,那就是十萬美元的薪水。我不必再做一個計程車司機,然後每週只有週末才有時間創作音樂。我實際上可以成為一個真正活躍的全職音樂家,很多人都可以這樣。這就可以創造一個市場,你知道誰在聽你的音樂,然後你就可以做得更多。


這實際上就是在生產者和消費者之間建立了連線。有了這種連線,一旦資料流通過,商品買賣就可以更流暢。所以藝術家可以說你只要付兩萬美元我就可以在你婚禮上表演,或者你是我的一個超級粉絲,你想來後臺...所有這些商品的形式都可能出現,而公司實際上就提供了這種可以賺錢的方式。他們提供這些平臺當然也應該得到一些錢,當然那到不了像一個標準代理人一樣可以獲取百分之五十的費用,不過百分之十也差不多,所以你知道你的音樂大師夢真的有希望了。


這家公司的 CEO 是 Steve Stoute,他是個了不起的人,也是我曾見過的最聰明的人之一。他曾在索尼旗下的唱片公司工作,後來建立了 Translation 廣告公司,並且完成了很多實際的東西。他了解很多音樂人,Steve 的經歷以及他的音樂背景,讓他剛好處於一個可以將音樂、技術和人聯絡在一起的位置。我認為我們的社群可以參與這種活動是非常令人激動的,而 Steve 就剛好給出了這把鑰匙。


去年我曾請他做一個開場演講。那場演講的主題是關於 Hip-hop ,自我賦權和解放,創造力以及這些該如何和資料科學聯絡起來。


機器學習與資料共享


現在還有一個資料共享的問題。


所有這些都還只是想法,如果我有時間的話就會進行實驗,所有這些都是想法的實驗。這些都只是我的一些研究建議,我的團隊可能會做的。我們這些時間主要是證明定理,但這裡還有一個資料共享的想法實驗。


640?wx_fmt=png


資料共享不是“AI”的問題,但卻是現實世界的“II”問題。很多公司都有資料,如果可以將它們放到一起,那將對他們有用,但這通常不被允許。法律上不允許出於很多原因,比如,在某天一個公司可能會遭受入侵或欺詐攻擊,但這可能同時發生在所有公司,也可能只針對特定的公司。


如果將每個人的資料都彙總起來,你就可以構建世界上最好的分類器,並且可以讓系統受欺詐的程度保持的相當低,但人們不會那樣做。為什麼呢?很多原因。你要怎樣激勵他們開始分享資料?你把你的資料傳送給我,是因為我是個值得信賴的中心人員,我會通過密碼機制或其他方式保護你的資料。


我會獲取你的資料,然後構建一個完美的分類器,然後再把它們送回去。我不會和任何人分享你的資料。但那並不是很有趣,因為可能我收到的資料中有欺詐資料。對公司來說,如果他們把真實的資料放到系統中,別人會得到比他們更多的優勢,所以他們不會傳送高質量的資料,他們不傻。


那他們應該傳送的資料質量要多高?系統應該有什麼激勵機制來讓他們衡量要傳送資料的質量?這還涉及到隱私問題,他們的律師就會一直強調不要傳送資料。所以這裡從機器學習的視角來說,有一種方式就是你讓每個公司自己決定要傳送的資料質量或者隱私,或者其它想要對資料進行的操作。比如,他們要把噪聲加到資料中,然後才會放心地把資料交出來。他們對這樣有些差異化的私人系統會感到滿意。


現在資料到了我這裡,我會用所有這些資料構建一個分類器,然後看這個分類器在測試集中的表現如何。之後我要做的是留出一個公司的資料,然後用其他公司的資料做訓練集得到一個分類器,然後看分類器效果多好。然後對比留出不同公司資料後得到的分類器。如果在某個公司資料是訓練集時,得到的分類器效果最好,就說明這個公司提供的資料是好的。


我可以僅僅通過在經典 Handout 方法中的一個損失函式量化資料的好壞。我現在要為每個公司做的是每次留出它們一個,然後就知道他們發給我的資料有多好,他們覺得要給我發多好的資料,以及資料差異有多大。並且一旦我知道了這些,我就可以進行評估,現在我做的是世界上最好的分類器。但我會把模型或者預測結果,根據它們發給我的資料質量返還給他們。


這也可以說是經濟學,我設定了一個博弈,有一些激勵的概念,並且可能存在納什均衡,而不是說誰都不發高質量的資料。但這個提議或許會是一個研究,可能不會有結果。


總之,如果很多事情你能擺脫傳統的思考角度,那麼這個社群將有很多路可以走。我不認為只靠深度學習的那群人可以實現那個目標。


完整視訊地址:https://www.youtube.com/watch?v=4inIBmY8dQI


精彩推薦

2018年3月30-31日,第二屆中國區塊鏈技術暨應用大會將於北京喜來登長城飯店盛大開場,50+區塊鏈技術領導人物,100+區塊鏈投資商業大咖,100+技術&財經媒體,1000+區塊鏈技術愛好者,強強聯合,共同探討最in區塊鏈技術,豪華乾貨禮包享不停。八折門票火熱搶購中!2018,未來已來,帶你玩轉區塊鏈。


640?wx_fmt=jpeg


AI科技大本營使用者群(計算機視覺、機器學習、深度學習、NLP、Python、AI硬體、AI+金融、AI+PM方向)正在招募中,後臺回覆:讀者群,聯絡營長,新增營長請備註姓名,研究方向。

☟☟☟點選 | 閱讀原文 | 檢視大會詳情

相關文章