人工智慧還是人工智障?

AIBigbull2050發表於2019-11-17

人工智慧並非 萬 能 鑰 匙,並非所有事情都能用人工智慧解決。但同樣,人工智慧也並非是虛無縹緲的新技術,它的身影已出現在生活中的方方面面。

談到人工智慧,相信各位讀者都不會陌生,字面意思也很容易理解。

有些人眼裡,人工智慧已經是一種很成熟的計算機技術,可以幫我們做很大的事情,大到預測區域性地區明天的天氣如何、分析金融市場的股票交易波動;也可以幫我們做很小的事情,小到拍照時的貼紙自動追隨人臉,推送我感興趣的新聞或商品,這些都可以用人工智慧實現。

但是在另一些人眼裡,人工智慧還是待在實驗室的新事物,它離我們的生活還很遠,我們現在接觸的人工智慧最多算是個人工智障,現在炒得大熱的人工智慧概念只是資本遊戲的噱頭,其實它什麼都沒有改變。

人工智慧並非萬 能 鑰匙,並非所有事情都能用人工智慧解決。但同樣,人工智慧也並非是虛無縹緲的新技術,它的身影已出現在生活中的方方面面。

在日常工作中,我發現很多身邊朋友以及網際網路從業者同樣對人工智慧存在不少誤解,我嘗試結合我過去的一些經驗,聊一聊我的看法。在此我們先聊聊,人工智慧的概念為啥突然這麼火。

一、人工智慧為什麼突然崛起?

很多人都誤認為,人工智慧是近幾年才被創造出來的新概念。

實際上最早提出“人工智慧”這個概念是在1956年美國達特茅斯學院的一次學術會議上。雖然當時這個會議只進行了一個月,也沒有取得什麼實質性的進展,但是這個會議首次正式提出“人工智慧”一詞,並且沿用至今。

儘管在當時,對於人工智慧的研究進展非常緩慢,但是經典的科幻電影《2001太空漫遊》還是表達了當時的人們對人工智慧的美好幻想。又經過了近50年的發展,人工智慧從電影的幻想逐漸走進了人們的日常生活,並且成為了各個領域的得力助手。

這個過程並非一帆風順。

上世紀80年代前後,日本人研究了一種能夠模擬人類專家決策能力的計算機系統,稱為專家系統。這個專家系統實際上就是一個巨大的知識庫,再透過一些推理規則讓這個系統能夠根據提問找到答案。

這種專家系統能夠根據輸入的問題,提供回答是當時人工智慧技術的代表,一定程度上也是計算機“智慧化”的表現。因此這個專案得到日本政府的高度重視,投入了大量的人力物力研究,希望能打造一個計算速度更快、知識儲備量更高的專家系統。受到日本人的刺激,同期美國和許多歐洲國家也紛紛進入到這個賽道中。

可以預見的是,專家系統最初取得的成功是有限的,因為它無法自我學習並更新知識庫,維護成本極高。就像以前沒有聯網的車載導航系統一樣,每年都需要更新地圖否則這個系統一年以後就廢掉了,無法給出正確的指引。

專家系統的失敗,也讓人們對於人工智慧的信任產生了巨大的危機,硬體市場的潰敗和理論研究的迷茫,加上各國政府和機構紛紛停止向人工智慧研究領域投入資金,導致了數年的低谷。

好在資本不再關注人工智慧的時候,人工智慧的理論研究還在緩慢進行中。1988年,美國科學家Judea Pearl將機率統計方法引入人工智慧的推理過程中,這對後來人工智慧的發展起到了重大影響。1989年,AT&T貝爾實驗室的Yann LeCun和團隊使用卷積神經網路技術,實現了人工智慧識別手寫的郵政編碼數字影像。

在此後近二十年,人工智慧技術逐漸與計算機技術、網際網路進行深入融合。得益於大規模平行計算、大資料、深度學習演算法和人腦晶片這四大催化劑的發展,以及計算成本的降低,使得人工智慧技術突飛猛進。

它利用計算機和網際網路的發展機遇,化名為商業智慧、資料分析、資訊化、自動化等等,滲透到社會發展的每個角落。

  • 一方面,網際網路的推廣為人工智慧創造了很多落地應用的場景,體現出真正的價值;
  • 另一方面,計算機軟硬體的升級為人工智慧提供了強大的運算力,以前在理論上才能實現的演算法得以落地,讓人工智慧在越來越多賽事上創造奇蹟,甚至超越人類。

2011年沃森在自然語言常識問答比賽中戰勝人類選手,ImageNet挑戰賽上影像識別演算法準確度超越人類;2016年,AlphaGo戰勝李世石,成為第一個戰勝世界圍棋冠軍的AI機器人…

二、人工智慧還是人工智障?

近兩年人工智慧被人們詬病最多的地方是:人工智慧體現不出智慧。

很多人對人工智慧的認知都是分裂的。一方面媒體不斷報導人工智慧又取得了什麼樣的新成果,國外各路大咖讓人們要警惕人工智慧的發展,人工智慧還被納入我國發展的規劃中等等。

另一方面,新聞裡經常傳出自動駕駛又發生事故,家裡的智慧傢俱表現地像個智障一樣,資訊平臺總是傻傻地推同樣型別的新聞等,這些現象都讓我們疑惑,人工智慧到底智慧在哪裡?

回答這個問題之前, 我們有必要搞清楚,強人工智慧和弱人工智慧的區別。

最初,在達特茅斯會議提出人工智慧一詞時並沒有強與弱之分。普遍認為人工智慧就是讓機器擁有思想,能夠像人類一樣決策。當時各種演算法的研究也是奔著這個目標而去,希望能夠模擬人類決策的方式賦予機器真正的智慧。

但很快就有人發現:在這種方式下實現的人工智慧並非真正的智慧,只是對人類智慧的模擬。美國哲學家John Searle提出了一個思維實驗:中文房間(Chinese Room Argument),它是這樣的:

想象一位只會英語的人身處一個房間之中,這間房間除了門上有一個小視窗以外,全部都是封閉的。他隨身帶著一本寫有中文翻譯程式的書。房間裡還有足夠的稿紙和鉛筆。

寫著中文的紙片透過小視窗被送入房間中。房間中的人可以使用他的書來翻譯這些文字並用中文回覆。雖然他完全不會中文,Searle認為透過這個過程,房間裡的人可以讓任何房間外的人以為他會說流利的中文。

值得注意的是,這本書僅僅是語法的對應,並不涉及到任何語義的說明。房間中的人,只需要按照對應的回答,拼湊出相應的中文字元遞出去即可。在這個過程中,他並不理解問題和他所寫的答案是什麼意思。

Searle認為,人工智慧就是這樣工作的。 他認為計算機根本無法真正理解接收到的資訊,但它們可以執行一個程式,處理資訊,然後給出一個智慧的印象。

例如影像識別技術,它的工作原理就是將顏色變成數字編碼,再從這些數字編碼中找到特徵,查詢字典,找到對應的解釋然後顯示出來。實際上計算機壓根不知道自己識別的到底是飛機還是兔子,只是字典告訴它這個特徵很大機率對應的是“飛機”這個單詞。

絕大部分演算法在本質上都是在玩機率的遊戲,不同的方式只是在模型訓練時需要的資訊不同,以及計算出來對應“飛機”的判定方式不同。

當前所有被廣泛應用的知名模型都是透過矩陣運算訓練資料來獲得某種機率分佈。複雜模型的機率分佈通常是高維的,這裡又會引申出各種數學方法,但本質的思想依舊是想透過機率分佈來描述訓練資料的特徵。有了這些,對於同類的資料,就可以使用相同的機率分佈去描述,從而實現所謂的“識別”或“預測”。

實際上並非模型真的像人類一樣理解了什麼是“飛機”,只是透過這種方式,模型能夠大機率把長得像飛機的圖片識別出來。

後來業界也普遍認識到這一點。因此把人工智慧這個概念又劃分為強人工智慧與弱人工智慧。

強人工智慧流派仍然追求讓計算機擁有人類的心智與意識,具有自主選擇行為。就像西部世界中從固化程式逐漸演化出自我意識的梅芙一樣。但是強人工智慧的研究難度較大,市面上還沒有成熟的應用。

而弱人工智慧更像是一個解決特定問題的工具。這類問題的特點是可以透過統計,歸納出經驗並形成解決方案,而這種解決問題的實現方法被稱為“機器學習”。

機器學習最基本的做法,是使用演算法解析資料、從中學習資料的規律,然後對真實世界中的事件做出決策。與傳統的程式設計方式不同,機器學習是用大量的資料進行訓練,透過各種演算法從資料中學習“如何完成任務”。

例如量化交易、人臉識別和AlphaGo都是擅長於單個方面的機器學習模型。在訓練模型時,我們只教會AlphaGo下圍棋的技巧,所以它只能會下圍棋。如果你把一道數學題丟給AlphaGo,顯然它是無從下手的。

所有的機器學習模型都只能完成特定的任務,很多時候我們透過組合的方式滿足更多的場景。例如智慧音響本質上是一個語音識別的模型結合NLP(自然語言處理)模型,它並非真的能聽懂我們說的話代表什麼含義,僅僅是能夠把接收到的資訊轉化為模型的輸入,在字典中找到對應的輸出而已。

從機器學習的特點可以看出來,如果想透過統計歸納經驗,資料的數量與質量是決定性條件。沒有資料,就沒有人工智慧。

也就是說在你沒有作出同類別行為,或者是與你行為相近的人群較少時,人工智慧是沒有辦法作出判斷的,這也是人工智慧變成人工智障的重要原因。當行為增加,資料慢慢變多,資料質量逐漸上升時,你會發現預測越來越準確,人工智慧透過大資料也能做到真正的“想你所想”。

三、什麼問題適合用機器學習解決?

前面我們說弱人工智慧像工具,專門解決某個特定的問題。但是否所有問題都適合用機器學習去解決呢?很明顯答案是否定的。

適合用機器學習去解決的問題,主要有三個基本條件。

(1)有規律可以學習。這類問題必須存在共性,有內在的規律等待被發現;

(2)程式設計難以實現。資料之間關聯關係複雜,很難透過窮舉的方式列清楚規則;

(3)有足夠多能夠學習到規律的資料。沒有資料支撐,機器學習就像搭好了結構少了磚瓦的房子。

舉個例子:

我們熟知的垃圾郵件檢測是一個使用機器學習解決的經典場景。最常見的垃圾郵件是各種型別的營銷郵件,並且這種郵件的傳送方通常是各類用郵箱註冊過的網站。在這個場景中我們發現,營銷郵件一定是包含某些產品資訊或推廣資訊,所以這類郵件有一定的規律。

但是因為不同產品種類各異,我們很難用程式設計的方式把所有規則寫出來。就算能寫出來,傳送方也會設計各種規則躲避系統的檢測,同時我們很容易找到大量垃圾郵件與正常郵件作為樣本資料。因此這個場景非常適合用機器學習的方式解決。

但如果我們想判斷新郵件包含多少個字元,恐怕就不太適用。雖然這個問題同樣難以用程式設計解決並且有大量歷史郵件支援,但包含多少個字元這個問題的隨機性太強,沒有規律可循,因此不適合。

由此可見,機器學習不是萬能的,不是所有的問題都能用它去解決。 機器學習擅長的是透過已知經驗找到規律去解決問題。如果面對的問題沒有任何規律可循,完全是一個隨機事件,那麼就算使用多複雜的機器學習演算法也是無濟於事。

值得注意的是,很多問題看似沒有規律,實際上是因為人類處理不了資料量太大的情況,看起來雜亂的資料掩蓋了背後的面目,這類問題並非真的無跡可尋,只是需要用正確的方法。

我們透過機器學習可以對大量資料進行分析獲得規則,並利用規律對未知資料進行預測。不但能從資料中看到人類能看到的規律,更重要的是能在更短的時間內發現人類看不到的規律,我想這就是機器學習最大的應用價值。

在醫學領域,透過影像識別技術,已經實現讓計算機自動識別腫瘤細胞,幫助醫生快速進行醫學診斷;在製造業,透過強化學習的方式自動檢測產品缺陷提高出品率,幫助企業加快生產週期降低生產成本;在金融領域,透過神經網路技術可以避免傳統程式化交易因為無法根據實時發生的市場變動調整演算法,從而造成資產損失的風險。還有在零售、安防、航空、網際網路等等不同領域,機器學習都有廣泛的應用,它已經對我們生活的產生了巨大的變化。

最後我們必須認識到,目前的人工智慧並非真正的智慧,只是一種模擬人類行為的智慧。而真正的智慧,離我們的生活還非常遙遠。但值得慶幸的是,僅僅是模擬人類行為的智慧已經能夠給我們的生活帶來了如此大的便利,相信隨著技術的發展,我們能夠做出更多超越想象的場景。





來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2664511/,如需轉載,請註明出處,否則將追究法律責任。

相關文章