《機器學習》作者Peter Flach:好萊塢也借AI上頭條(圖靈訪談)

劉敏ituring發表於2016-08-31

訪談物件:

Peter Flach,布里斯托大學人工智慧教授,擁有20多年的機器學習教研經驗。在高度結構化的資料探勘以及通過ROC分析來評估和改進機器學習模型方面,Flach是國際領先的研究人員。他著有Simply Logical: Intelligent Reasoning by Example,也是Machine Learning期刊的總編。曾擔任2009年ACM知識發現與資料探勘國際會議、2012年歐洲機器學習與資料探勘國際會議的程式委員會共同主席。

enter image description here enter image description here

《機器學習》是迄今市面上內容最全面的機器學習教材之一,書中彙集了所有用於理解、挖掘和分析資料的先進方法,並且通過數百個精選例項和解說性插圖,直觀而準確地闡釋了這些方法背後的原理,內容涵蓋了機器學習的構成要素和機器學習任務、邏輯模型、幾何模型、統計模型,以及矩陣分解、ROC分析等時下熱點話題。

本書寫作思路清楚,邏輯性強。作者首先介紹了機器學習的基礎知識,然後提供了大量有價值的結論、對若干機器學習技術效能的洞見,以及許多核心演算法的高層虛擬碼,巧妙地引領讀者循序漸進地學習。 ——Fernando Berzal,Computing Reviews

訪談內容:

點選檢視英文版

電影《機器姬》裡,藍書軟體公司CEO——Nathan Bateman利用世界範圍內的資料搜尋、資訊處理來培育人工智慧,成功創造了兼具人類外表和思維的機器人Ava。科幻電影有一定的前瞻性,所以機器學習的深入真的能讓AI成為現實嗎?人工智慧是禍還是福?

enter image description here

《機器學習》作者Peter Flach:好萊塢也借AI上頭條(圖靈訪談)

任何形式的智慧,無論人工創造的與否,都要通過經驗、和周圍環境的互動獲得提高發展。的確,機器學習是人工智慧領域裡重要的一部分,但它還需要比如常識推理、計劃等其他的能力。

人工智慧的福禍取決於我們如何使用它,對它採取怎樣的保障措施。在某些領域,人工智慧技能已經取代了人類,所以我們(不能陷入無盡的恐慌之中)而要想辦法確保這些人有其他的工作可做。機器人對抗人類、擁有自主追求的想法,目前來講還不大可能,但人類確實需要考慮如何避免這種情況的發生。如果這只是個有趣的哲學問題就好了!

機器學習在大資料處理方面如何起作用?請給我們簡單介紹下。

首先,你要問問自己,蒐集到的資料有沒有包含足夠的資訊解決問題。最好把問題簡化到幾乎可以動手就能解決的程度,然後看看利用這些資料構建的機器學習模型是否可以解決這個簡單的問題。如果可以,你再進一步增加問題的難度;如果不可以,就需要蒐集更多更好的資料!

語音識別技術是機器研究領域的一個重要方向。在2015年語音識別頂級會議interspeech上,關於魯棒語音識別領域的識別模型主要基於深層神經網路。這是否意味著訊號級別上的語音增強、降噪、過濾已經過時了?

深度學習在語音和影像識別方面非常成功。雖然很強大,但深度學習需要大量的資料支援和高密度地運算。這對人類來說還是個“黑匣子”,我們雖然可以利用它解決一些問題,卻不知道如何構建。有些技術比如過濾很容易理解,我們也可以根據使用情況判斷技術的重要性。就比如,許多人並不知道汽車的工作原理,卻絲毫不影響他的駕車技術;但如果要駕車穿過撒哈拉大沙漠,他就必須瞭解汽車是如何工作的。

目前人們用來開啟“黑匣子”的一個做法是,先訓練深層神經網路得到良好的效能,然後根據深層神經的輸出結果,訓練淺層神經網路或者其他解釋性技術,來理解“黑匣子”。

前段時間,AlphaGo和李世乭的圍棋對弈很火。您是否可以從機器學習的角度給些建議,比如AlphaGo應對挑戰時,如何進行搜尋,獲得應對走法?在無數的可選走法中,如何做到全域性觀把握?

在玩兒圍棋或者Go這樣的遊戲時,電腦會通過一個包含所有可行走法的資料樹,不僅包括自己的應對走法也充分考慮對手的走法。這個樹的所有資料都是AlphaGo自己跟自己對抗時獲得的,賽數驚人得大,就算我們一生都在玩圍棋也無法完成。這樣,它會形成兩個深層網路:一個用來計算每種可行走法,一個用來計算每個棋盤位置。這種學習叫作強化學習。在《機器學習》裡,我並沒有涉及強化學習的內容。假如時間允許,我會考慮在第二版里加入這部分內容。

這次人機大戰中機器的勝利會不會鼓勵更多的人學習研究機器學習?

我開始系統研究機器的時候,並不是每個人都認為電腦科學是門真正的學科,更別說人工智慧、機器學習這些不尋常的領域了。現在,好萊塢電影、人機對戰等都加入了這些引人注意的元素,確實是件好事。卻也不免充斥著大量的炒作,誘導人們產生不切實際的期望。以學術態度系統地研究機器,追求的是,事物間細微的差別而不是大肆的宣傳。當然,越多人研究學習機器對機器學習的發展越好!

您能給機器學習方面的自學者提供些建議嗎?他們首先需要做哪些方面的準備?

構思《機器學習》的時候,我有嘗試考慮自學者的需要,但他們確實需要一些背景知識方面的準備:一點概率和統計方面的知識,懂點兒邏輯和線性代數。另外,最好還能玩轉一些機器學習軟體:Python的scikit-learn現在很受歡迎,R和Matlab也提供了很多機器學習庫。這些準備讓讀者瞭解機器學習能做什麼,然後我的書能幫助他們瞭解機器學習怎麼工作。


——更多訪談


更多精彩,加入圖靈訪談微信!

相關文章