2018 AI World 觀後感——周志華教授part

Zhang_xiangcai發表於2018-09-30

2018年9月30日在老師的推薦下看了2018年人工智慧峰會,沒看完,今天看的是周志華教授的部分

主要思想是 機器學習,或者說深度學習 成功的背後,有什麼支援著,這些支柱有什麼能改進的地方。

(黑體字為會議內容總結,紅字為觀後感,或者說一些學習結果)

  雖然一直在接觸深度學習,實際上對於其在工業方面的應用並不是特別清楚,今天特意去查了一下,發現深度學習真是撐起了今天應用程式的一片藍天,自動識別,自動處理,提取資訊進行分類,可以說和智慧化息息相關。

  周志華教授主要提及了三個方面:深度模型,監督資訊以及人物環境

關於深度模型:當前主要面臨 深度學習==深度神經網路的局面,這二十多年來取得了很大的進展,但面臨臨界狀態,神經網路模型過於複雜!於是南大的研究室最近提出了 深度森林的想法,拋開神經網路模型和BP演算法,而是基於非可微函式建立模型,據教授說,在處理離散資料方面效率可能接近 神經網路。

關於監督資訊:周志華教授提及,目前機器學習依靠著強監督資訊建立體系,但是隨著演算法複雜性的增加,需要的資料越來越多,對應的監督資訊也會成為問題。所以說弱化監督資訊的比重是很有意義的。

  大資料時代,樣本不成問題。(錯) 這些資料是需要人工處理,標註的。

資料標註現在已經發展成一種職業,具體是 從各種渠道獲取資料,並且進行分類,標記整理。

例如,現有一個影像識別模型,利用機器學習的相關演算法來實現,那麼就需要資料去訓練模型,還有交叉驗證,還有測試。

也就是說,資料集按需求分成了 訓練集,交叉驗證集以及測試集。而在訓練集中,可能有一張飛機的照片,我們就需要進行資料標註,告訴計算機,這是一個飛機,以後看到類似的東西就將其識別成飛機吧。這就是資料標註的意義。擔任相關工作的人員可以發展成資料庫管理員,因為對資料的走向脈絡相當清晰。

而繞了這麼一個圈子,監督資訊是什麼呢?

經過這兩天查閱的,並不完全的資訊,我覺得監督資訊就是對資料進行的標註。周志華教授的演講中也說,Alpha Zero 雖然不用人類棋局的資訊,而是機器博弈,但是它獲得了極強的堪稱上帝的監督資訊,即判斷棋局的輸贏,我覺得這就是一種資料標註。

 

關於任務環境:主要探討的還是模型的穩定性。在資料變化的時候,我們能否保證robust性呢?

並且值得注意的是,很多時候我們探討的強化學習技術(是指 deep reinforcement learning嗎?),與環境進行互動,改變資料的來源,實際上並沒有改變實質,沒有挑戰規則,試問當整個規則都變化了,我們的模型能真正穩定下來嗎?這個問題值得深入探討。

 

受益匪淺!!

 

 

 

相關文章