谷歌AlphaGo的勝利：不是計算機打敗了人類，而是人類打敗了人類

【編者按】作者北大軟體與微電子研究院研究生畢業，圍棋業餘5段，現參與線上圍棋教育開發專案。

“珍珠港遭到空襲！這不是演習！這不是演習！這不是演習！”

——2016年1月28日凌晨

從昨晚開始，一條聲稱某AI在19路棋盤上分先戰勝樊麾二段，並且論文已登上Nature的訊息刷爆了朋友圈。一開始，就像以往的那些“大新聞”一樣，大家都認為是標題黨，甚至某業餘7段還查驗到其論文尚未被Nature稽核透過。

然而隨著時間的推移，越來越多的近距離詳細訊息傳來，開始有人相信訊息的真實性。圍棋圈內的各種微信群、朋友圈都在不斷地爭論，相信的人越來越多，不信的人也堅持己見。

終於，在接近凌晨兩點，又一條最新報導來了，這次還附帶著棋譜：《面對谷歌圍棋AI，人類最後的智力驕傲即將崩塌……》（雖是真訊息，但稍有標題黨之嫌）至此，看到棋譜的所有人幾乎都相信了：人工智慧AlphaGo，實現了里程碑式的一步。

| 首先，在客觀上要肯定AlphaGo實現的水平進步

從昨晚開始，一條聲稱某AI在19路棋盤上分先戰勝範麾二段，並且論文已登上Nature的訊息刷爆了朋友圈。一開始，就像以往的那些“大新聞”一樣，大家都認為是標題黨，甚至某業餘7段還查驗到其論文尚未被Nature稽核透過。

然而隨著時間的推移，越來越多的近距離詳細訊息傳來，開始有人相信訊息的真實性。

圍棋圈內的各種微信群、朋友圈都在不斷的爭論，相信的人越來越多，不信的人也堅持己見。

終於，在接近凌晨兩點，又一條最新報導來了，這次還附帶著棋譜：以往最強的圍棋AI，大致是CrazyStone、Zen和銀星圍棋這幾個。

而AlphaGo在讓以上幾個程式（無銀星圍棋）4子的情況下，取得了80%左右的勝率。我們據此基本可以判斷，人工智慧將自己的水平上限一下子提高了5個子。

樊麾二段，雖然以歐洲冠軍聞名於世，但其實圈內誰都知道他是一名中國旅歐教學的職業棋手。

雖然遠離東亞職業一線，但樊老師的水平仍然是不容置疑的，他依然有著職業的水平（雖然是較弱的職業），一般的業6仍然是比他不上的。

AlphaGo在正式比賽中對樊老師5：0（棋譜已可見），據說加上非正式比賽的總分為8：2（已確認），再加上棋譜裡AlphaGo顯示出的驚人的表現，我們可以認為，人工智慧在圍棋上的水平已經邁入了職業的大門。

（最新：據多位頂尖棋手對棋譜的鑑定，認為AlphaGo的水平應該在業餘強6段到弱職業之間，離人類頂尖大概還有一先到兩先的差距）

說的更明白點，之前的AI在蒙特卡洛演算法的幫助下雖然取得了革命性的進步，戰勝了絕大多數的人類，但人類中能戰勝那些AI的人數可能仍然在近百萬的級別。

而自今日（其實已經是三個月前了）的AlphaGo起，能在圍棋盤上戰勝AI的人類人數可能已經不到千人了。

按照Facebook人工智慧研究院的田淵棟老師的說法，這個訊息在相關研究圈內應該早就不是新聞了。

甚至回想一下昨天祖克伯在facebook上突然發聲支援自己的研究團隊，也因為是知道了google團隊的成果即將在一日內公示，所以想要搶佔一個在輿論的位置。

（田老師參與的facebook的研究團隊，是google現在最大的競爭對手，田老師他們使用的方法應該不太一樣，雖然他們暫時落後，但我同樣也很期待他們的下一步進展）

總之，從事實看來，這不是演習已經是顯而易見的事實。

接下來談點個人對人工智慧的粗淺理解。

| 蒙特卡洛演算法之後，我看到了新的天地

近些年來，儘管在蒙特卡洛演算法的幫助下，AI實現了革命性的進步，達到了能戰勝大部分人類的水平（中等業餘5段），但隨著摩爾定律的走向終點，計算機硬體的發展速度在舊有的道路上暫時無法按以前的速度爆炸發展下去，大家都認為僅憑蒙特卡洛演算法是無法幫助AI戰勝人類的。

依據個人的理解，我曾將圍棋的思維過程分解為四步的演進：常識→棋感→計算→判斷。

大約一年前，我曾和李喆七段就此問題進行過簡單討論，當時我認為蒙特卡洛演算法的成功主要在於為人工智慧建立了“棋感”，而以往的人工智慧只能在“常識”和“計算”具有天然優勢。

在蒙特卡洛演算法之前，雖然計算機憑藉強大的計算力可以積累大量“常識”，但由於“棋感”的缺失，人工智慧無法對計算方向進行有效的篩選，最終就不免淪於蠻力搜尋。

而蠻力搜尋雖然可以在一定程度上實現高水平的“計算”，甚至很多其他棋類都在這一環節上被人工智慧打敗，而由於圍棋的過度複雜和摩爾定律結束對計算機發展前景的限制，走到這一步仍然無法讓人工智慧戰勝人類。

谷歌AlphaGo的勝利：不是計算機打敗了人類，而是人類打敗了人類

（注：上圖為計算機眼中的國際象棋落子思路，而下圖為計算機眼中的圍棋落子思路，來自谷歌deepmind官網AlphaGo | Google DeepMind）

谷歌AlphaGo的勝利：不是計算機打敗了人類，而是人類打敗了人類

而蒙特卡洛演算法出現後，憑藉大量儲備的棋局，透過勝負機率來判斷下一步著點以作為計算方向，極大的提高的計算的效率，所以AI的水平才實現了革命性的進步。

而這次的AlphaGo，使用了深度神經網路與蒙特卡洛樹狀搜尋相結合的方法。

依據已經能看到的Nature上的論文（可見雷鋒網文章：《Google人工智慧擊敗歐洲圍棋冠軍， AlphaGo 究竟是怎麼做到的？》），研究者們在AlphaGo中加入了兩個深度神經網路，以value networks來評估大量的選點，而以policy networks來選擇落子，並且開發了一種新式演算法來結合蒙特卡洛演算法和以上兩個神經網路。

谷歌AlphaGo的勝利：不是計算機打敗了人類，而是人類打敗了人類

（注：上圖為AlphaGo使用的神經網路結構示意圖，來自原論文）

在這種結合下，研究者們結合參考人類職業對局的監督式學習，和AI大量積累自對弈實現的深度學習，來訓練和提高AI的圍棋實力。

在蒙特卡洛演算法之後，我看到了新的天地。這種結合以及新式的思路，讓人感到前景無限。

最後談一談，我認為我們應該保有的態度。

| 如何面對人工智慧？

這裡，我首先想引用李喆七段在今天早上說的話：

“我們已來到兩個時代的連線處，無論你是否願意，這都是一個需要接受的事實。工具無善惡，善惡在人心。未來的路通往何方，將由我們自己決定。”

從凌晨到早上，朋友圈裡的評論區一直爭論不休，甚至某世界冠軍一直在說“不信”，畢竟大家在沒有看到板上的釘子之前，從情感上都是不願意相信的。直到另外兩位一線棋手告訴他，已經可以看到棋譜了......

面對這個事件，接下來將會有很多的爆炸性新聞報導，以及各種各樣姿勢的討論。

我們要知道：

一．人工智慧的確實現了很大的進步。

這次的進步可能是革命性的，這次新聞宣稱的AI取得的成績並不是“標題黨”。

二．人工智慧還沒有戰勝人類（什麼所謂“人類最後的驕傲陷落”都屬於“標題黨”）。

但朝著這個方向邁出了一大步，而且是在很多人在蒙特卡洛之後不看好AI下一步發展的情況下，來了一個突然襲擊（谷歌從開始研究到出成果再到釋出，一直憋一個大新聞憋這麼久也真是能忍）。

三．人工智慧戰勝人類的時點，可能比很多人想象的要來得更早了。

不是之前設想的生物計算機或者量子計算機出現後，甚至都不是新材料取代矽晶片之後，在這個時代就有可能出現了。也許是五十年後，也許是二十年後，甚至可能是十年後。

從小學時開始，我就痴迷於許峰雄教授對於計算機國際象棋專案的研究和成就，一直追蹤到97年“深藍”戰勝卡斯帕羅夫。（就是在那之後不久，我才從國際象棋轉投了圍棋......）

谷歌AlphaGo的勝利：不是計算機打敗了人類，而是人類打敗了人類

（注：上圖為第一個打敗人類的計算機國際象棋程式“深藍”之父——許峰雄）

從中學時代到大學時代，我一直追尋著許教授的動態和他撰寫的各種文章、書籍，他寫的《“深藍”揭秘》被我翻的都爛了，我甚至在中學時代一直想以此作為未來的求學從研的方向。

許教授離開IBM、前往亞研院並聲稱準備致力於作為最終問題的計算機圍棋難題之後，我仍然一年年心心念唸的期待著許教授的後續動作。

然而十多年過去，等來的卻是無數的後來者。

這也挺好，人類就是不缺後來者。

看許教授對當年研究過程的講述，最大的感受就是：

其實並不是計算機打敗了人類，而是人類打敗了人類。

大量的計算機專家，配合大量的國際象棋職業棋手，在演算法上不斷革新，再搭乘上摩爾定律的東風，不斷的失敗再重來、輸了再修正，最終才解決了計算機國際象棋難題。

卡斯帕羅夫，是敗給了數以百計的人類專家的智慧的合力。

圍棋也會是一樣，計算機——今天說人工智慧更合適，戰勝人類的那一天遲早會來，大部分人都從來不否認這一點。

爭論，始終在於這一天的早晚。

而棋手和圍棋從業者們，出於可以理解的感情，總是希望並認為這一天不會來得那麼快，但他們絕對不會拒絕甚至仇視這種進步。

其實我看到的很多人，都一直期待並讚許著人工智慧的進步，甚至很多職業高手還親身參與和幫助著計算機圍棋專案的研究。我們努力打造著一個“大玩具”，一個能戰勝自己的“大玩具”。

所以最終的成功，是我們人類自己的成功，而不應該對計算機感到恐懼。

同時，這“大玩具”也不只是好玩而已，人工智慧對於現代乃至未來科技的發展有著極大的意義，這意義甚至會超出當年原子彈研究的後續紅利。

所以不要害怕，不要煩惱，讓我們期待著人工智慧在圍棋上戰勝人類的那一天的到來吧。

我之前一直認為在我有生之年是看不到這一天的，然而現在看來，我錯了。

我一點也不失望，反而感到很興奮，很激動，並且期待著以google和facebook為首的前沿研究團隊們的進一步的表現。最後的最後，恭喜谷歌，恭喜圍棋，恭喜人類。

另外，文字先發於知乎（我的知乎ID：高飛龍），希望也能與雷鋒網的讀者們一起分享，歡迎留言探討。

谷歌AlphaGo的勝利：不是計算機打敗了人類，而是人類打敗了人類

相關文章