1955年,當人工智慧這個詞首次被提出來時,不出所料地點燃了公眾的想象力。在接下來的60年裡,我們有好幾次都被它的前景所吸引,擔心它的潛力被濫用,但又為它的發展緩慢而沮喪。
然而,正如所有孕育得過早、超越了當前時代的先進科技一樣,人工智慧遭到了廣泛的誤解——被好萊塢電影錯誤地詮釋、被媒體曲解為各種各樣的角色,從人類的拯救者到毀滅者,應有盡有。但那些真正參與到業界的嚴肅資訊科學研究和應用的人卻很理解智慧系統的巨大潛能。這種技術(我們相信那將是「認知智慧」而非「人工智慧」)的 未來與大眾冠以AI的名頭大不一樣,將涉及各種各樣的、來自技術、科學和社會的挑戰與機遇,面臨不同的監管、政策和管理需要。
認知計算是指一種能夠規模化學習、有目的推理、並與人類自然互動的系統。它們不需要事先精確地程式設計,而是從它們與我們之間的互動和與環境之間的互動中學習和推理。過去半個世紀中,多個科學領域的發展使這些事情變得可能,它們與那些執行著它們的資訊系統有著重要的區別。
那些資訊系統是決定論的,而認知系統是機率性的。認知系統不僅能回答大量的問題,還能對更加複雜(且有意義)的資料提出假說、推理論述和建議。
此外,認知系統還能理解電腦科學家稱之為「非結構化」的資料,而這些資料佔到了全世界資料的80%。這使得它們能夠跟上現代世界巨量、複雜和不可預測的資訊。
這些與機器的感覺能力和自主性都沒有任何關係。相反,它能夠增強人類的能力,讓我們可以理解和運作社會中複雜的系統。這種增強智慧對提升我們駕馭科技的能力是十分必要的一步,讓我們能追尋更多知識、提升我們的能力和改善人類的境況。這就是為什麼它不僅是一種新科技,還是科技、商業和社會新紀元——認知時代的黎明。
認知計算的成功並不以圖靈測試或模擬人類的能力作為判斷標準。它的標準更加實際,例如投資報酬率、新的市場機會、治療疾病和拯救生命。
在IBM,為建立認知計算的基礎,我們已經工作了數十年,將前沿電腦科學領域的十幾個學科與這個100多年的商業專家結合起來。現在,我們正在親眼目睹它在改變商業、政府和社會方面的巨大潛力。
我們已經看到,它將大資料從障礙變成機會,幫助兒科醫生做出早期診斷,為建設智慧城市提供創新解決方案。我們相信,這些技術展現了最好的(或許也是唯一的)機會,去處理地球面臨的一些最持久的系統性問題,例如癌症、氣候變化和複雜多變的全球經濟形勢。
計算的歷史與認知的崛起
為了理解認知計算的未來,必須把它放到歷史的語境中。
到今天為止,我們經歷過兩個不同的計算時代——製表時代和程式設計時代。IBM在這兩個時代中都扮演了重要的角色。我們相信,在計算演化史中,認知計算是第三個、也是最具有轉折意義的時代。
製表時代 (1900-1940年代)
計算機起源於一種單一計數用途的機械系統,這種系統用打孔卡來輸入和儲存資料,最終決定這個機器要做的事情 (雖然是以一種非常原始的方式)。這些製表機本質上是一種計算器,支援了商業和社會規模的擴大,幫助我們組織、理解以及管理從人口增長到全球經濟進步等的各種事情。
程式設計時代 (1950年代-現在)
在二戰的時候,隨著軍事和科學的需要,從機械製表機到電子系統的演變開始了。在戰爭之後,數碼「計算機」經歷了快速演化,逐漸進入商業和政府。它們可以根據軟體中的程式來進行 如果/就 的操作以及迴圈。從最開始的電子管到電晶體,再到微處理器,計算機的效能得到了迅速提升,這一發展過程驗證了「摩爾定律」,在60年間,每18個月處理器的容量和速度就提升一倍。所有我們知道的計算裝置,從大型主機到個人電腦,再到智慧手機和平板,都是可程式設計的計算機。
認知時代 (2011-)
早在1960年,J.C.R. Licklider就在他的論文「人-機共生」中 提出了 超越可程式設計系統的潛在可能性。現代計算的很大部分都是基於LickLider的研究以及他的深刻見解:
「人-機共生」是在人類與電子計算機之間發生的共生關係,是人機關係間可以預見的發展。這種關係包含人類與電子夥伴強耦合關係。主要目的是:
像為解決規劃難題提供便利一樣, 也讓計算機為規劃思維提供便利。
在不依賴於不靈活的預定義程式的情況下,讓人與計算機能夠協作決策,控制複雜情況。
初步分析表明,與人類單獨進行智慧操作相比,共生關係將會更有效。
——J.C.R. Licklider,「人機共生」,1960年3月
Licklider知道,認知計算將是程式化計算的必要的自然演化,雖然他並不知道這個目標如何實現。50年後,大規模平行計算以及浩如煙海的結構化與非結構化資料的積累,為認知計算奠定了基礎。
世界首個認知系統
在2011年2月,Watson專案首次公開,Watson是IBM開發的認知計算系統,它在Jeopardy!節目中戰勝了肯·詹寧斯和布拉德·魯特爾。這是首次面向公眾證實認知計算,標誌著所謂AI寒冬的終結。可程式設計系統在之前60年的演化中並未能夠理解混亂的非結構化資料,因此也參加不了Jeopardy!節目。Watson能夠回答微妙、複雜、語義雙關問題,顯然,計算新紀元即將開啟。
節目之後,Watson繼續處理了更多的複雜資料集,在解謎之外,它發展出了理解、推理以及學習的能力。認知計算的目標就是照亮以往在我們世界中不為人知的部分——具體來說就是潛藏在非結構化資料中的模式和洞察——使得我們能夠對更重要的事情做出更明智的決策。認知時代的真正潛力將會是機器的資料分析、統計推斷能力,以及人類特殊能力,比如自我引導的目標、常識和價值觀。
這正是Watson被賦予的使命,也是它正在嘗試做的事情。銀行正在分析客戶要求和金融資料,幫助自己更好地做出投資決策。高度監管產業中的企業不斷在系統中查詢,保證自己跟上經常變化的監管和合規標準。腫瘤學家利用專家經驗和研究手段,測試認知系統能否幫助他們理解癌症患者醫療資訊,找到個體化、循證的治療方案。
這樣的經歷對於牽涉其中的專業人士來說意味著什麼?世界知名的腫瘤學家,紀念斯隆-凱特琳癌症中心的Larry Norton博士正與Watson合作幫助內科醫生對患者進行個性化癌症治療。他說:「電腦科學發展迅猛,醫療事業也會受其影響。這被稱為協同進化(coevolution)。我們要互幫互助。我預想這樣的場景:病人、電腦、我的護士、我的研究生同事還有我自己都在監察室一起交流。」
在Watson的象棋博弈前輩Deep Blue在1997年擊敗世界象棋冠軍Garry Kasparov之後,我們首次看到這種共生的跡象。在那次演示之後,Kasparov繼續參加這種新「自由式」的象棋聯賽,在其中,選手們可以自由地使用任何他們喜歡的計算機程式。在這些聯賽中,一些選手孤身奮戰。一些完全依賴於計算機程式。但那些將計算機與他們自身的直覺和比賽天賦相結合的選手是最成功的。
「機器與人相配合的團隊甚至比最強大的計算機更具優勢。人類策略上的指導與計算機戰術上的敏銳結合起來是所向披靡的。我們可以集中精力於策略規劃而不是把那麼多時間花費在計算上。在這些情況下,人類的創造力是最重要的。」
——加里·卡斯帕羅夫
前行的技術之路與何以可能的科學
當Licklider為認知計算幫忙想出一種哲學方法時,他幾乎無法表達出前行的技術進路。那條道路仍在被定義,不斷調整。尤其是,我們敏銳地意識到資料正怎樣塑造著我們的未來。Gartner預計世界的資訊將增長800%在未來5年,而且80%的資料是非結構化的。包括人類語言記載下的每一件事(從教科書到詩歌),圖片捕捉到每一個瞬間(CAT掃描每個家庭照片)以及聲音記錄下的每條資訊。它是隱藏在氣味、味道、文字和振動中的資料。它來自我們的活動,來自這個佈滿儀器的星球。
在價值日益源於資訊、知識和服務的社會和全球經濟中,資料代表著這個世界上最富有,最具價值,最複雜的原材料。直到現在,我們還沒有方法對它進行有效開採。
可程式設計系統基於這樣的規則:透過一系列預先設定的程序,從資料中得出結論。儘管它們強大而複雜,也是決定論的——其繁榮建立在結構化資料之上,但是無法處理定性或不可預見的輸入。面對正在興起的充滿模糊和不確定性複雜新世界中的眾多方面,這種死板束縛住了它們的拳腳。
認知系統是基於機率的,意味著它們被設計成去適應和理解非結構化語言的複雜性和不可預測性。他們可以「讀」文字、「看」影像、「聽」自然語音。它們闡釋那些資訊,整理它以及提供他們意思的解釋,還伴有它們結論的基本原理。他們不提供最終的答案。事實上,他們並不「知道」答案。相反,它們被設計成從多個來源中去衡量資訊和想法,去推理,然後提供假說以供參考。一個認知系統給每個有潛力的洞見或答案分配一個自信水平。
Watson在 Jeopardy!中犯的一個錯誤就是例證。在第一天的比賽將結束時, 「Final Jeopardy」的類目是「美國城市」。線索是「以二戰英雄命名的最大的機場;二戰的戰役中第二大的。」答案是芝加哥(O’Hare 和 Midway)。Watson猜測為多倫多。Watson困惑於這個問題有很多原因,包括它的語法結構,在伊利諾斯州有一個城市叫Toronto並且Toronto Blue Jays在美國棒球聯盟中打棒球。
結果,Watson自信水平出奇得低:14%。如果這是Jeopardy!常規線索,而不是「Final Jeopardy」階段的線索,參賽選手很可能會響鈴,但是Watson不會響鈴,因為答案自信水平太低。Watson知道哪些事情是它不知道的,圖2中的5個問號暗示了這一點。
然而,認知系統能夠從錯誤中學習。透過大規模機器學習,認知系統能從訓練和運用中不斷得以改善。
消化語料庫知識,根據任何給定主題接受專家訓練,認知系統可以透過一系列Q&A的方式得以訓練。人與系統互動,就係統反饋的正確性做出反應將會提升機器的「知識」。
當Watson參加Jeopardy!時,它完成了一件事——以五種技術為基礎的自然語言Q&A。今天,Q&A僅為Watson眾多以API方式提供的功能之一。打那以後,我們已經研發出多達20多個新的API,採用了50多種不同認知技術。這也是認知計算的技術進路和當前人工智慧進路的關鍵區別。認知計算並不是電腦科學的孤立領域。需要許多學科知識,從硬體架構,演算法策略,工業流程設計到行業專長。
我們每天使用的許多產品和服務——從搜尋引擎廣告應用,社交媒體網站面部識別到「智慧」汽車,電話和電網——正在見證人工智慧的方方面面。
絕大多數人工智慧產品和服務都是為了實現某種功能目的,側重應用,專為某種特定服務而設。它們使用了一些認知計算的核心功能。一些使用了文字挖掘技術。其他的採用機器學習進行影像識別。所有的產品和服務都侷限於最初打造它們的構想。
相反,認知系統有五個核心功能:
1.與人的接觸更加深入。
人們與系統的互動更加充分,這種互動是以每個人偏好的模式、形式以及質量為基礎的。它們充分利用搜集到的資料創造出有關個體的精細畫面——比如,地理位置資料,網頁互動,交易歷史,鍾愛節目的模式,可穿戴裝置資料和電子醫療記錄——併為這幅圖景新增一些很難察覺的細節:品味,情緒,情感狀態,環境條件以及人際關係本質和強弱。從所有結構和非結構資料中進行推理,找出什麼才是人際交流中重要的東西。透過不斷學習,這些接觸交流將傳遞出越來越大的價值,也會變得更加自然,有預見性,情感也會拿捏適中。
2.規模化和提高專業技能:
各種工業知識和專業知識正在以任何專家不能趕上的速度迅速膨脹——雜誌、新協議、新立法、新實踐和嶄新的領域。醫療保健中有一個明顯的例子,在1950年,人們預測全世界醫學知識翻一番需要50年時間;到了1980年,時間縮短為7年;2015年,不超過3年。與此同時,個人一生能產生一百萬GB的健康資料,相當於3億本書。
為了幫助組織機構跟上步伐,人們設計了認知系統,它能作為專家的夥伴以提高他們的業績。由於這些系統掌握了專業術語——醫學、銷售和烹調等術語——他們能夠理解和傳授複雜的專業技能。縮短了由內行變為專家所需的時間。另外,由於這些系統是由領先的從業人員訓練的——不論是顧客服務,腫瘤診斷,還是判例法等任何行業——系統就能讓很多人獲取這些領先人士的秘訣。
3.用認知融合產品和服務:
認知技術讓感受、推斷和了解使用者和周圍世界的新一類產品和服務成為可能。持續改善和適應,增強功能以推出未曾想到的新用法,也因此成為可能。在汽車、醫療裝置、器具和玩具行業,這些正在發生。物聯網正在急劇擴充全球的數字產品和服務——哪裡有程式碼和資料,哪裡就有認知技術的用武之地。
4.認知運營成為可能:
認知也能轉變公司運營的方式。 融合認知功能的商業運營,能將內外資源中的資料表象化為財富。 它讓公司重視工作流程、文字和環境,這有利於持續性學習、改善預測和提高運營效率——以當今的資料流動速度做出決策。在這樣的領域,比如市值平均10億美元的公司每週花1,000人的工作時間用於供應商管理,這就是個好訊息。
5.提升探索發現:
最終,認知商業將會擁有的最強工具是好得多的、可以照亮日益複雜又不穩定未來的「前燈」。
隨著各行各業的領軍人物爭相在藥物研發、複雜經濟模型、材料科學、初創公司上放上大籌碼,這樣的「前燈」變得越來越重要。把認知技術運用到大資料上,領軍人物能找到規律、機會和可執行的假設,僅僅透過傳統研究或可程式設計系統,幾乎不可能發現這些。
假如能像設想的那樣實現認知計算,那麼,底層平臺必須足夠寬廣、足夠柔性,以便在各行各業得到運用,它還必須支援跨行業運用。這需要一種全盤的研發進路,旨在打造一個強健的平臺,它有許多功能可以支援來自開發者生態圈各種各樣的應用。
這個平臺必須涵蓋機器學習、推理、自然語言處理、語音和影像識別、人機互動和對話和敘述生成等等。許多功能要求運用高效能運算,專門的硬體結構,甚至是新的計算範例這樣的專業基礎設施。每種技術都源自自身科技或學術領域。但是,這些技術必須和支援認知結果的硬體、軟體、雲平臺和應用協同發展。
隨著沃森的迅速演化,未來可能已初見端倪。舉個例子,一種分析X光,MRIs和超聲波影像的認知醫學影像應用,它能處理醫學期刊、書本和文章的自然語言。它利用機器學習來矯正和增強理解力。它還可以開發深度知識表徵和推理,有助於形成可能的診斷結果。為此,需要專門影像處理器來支援大規模資料和人類專業知識,指導系統學習, 解讀系統生成的結果。
這種新模型的威力能用到任何領域。油氣公司能把地震影像資料和對成千上萬的論文、報告、時事、經濟資料和天氣預報的分析結合到一起,為開採提供風險回報分析。或者,透過分析測試成績、出勤率和數字學習平臺上學生行為資訊,學校能建立縱向的學生檔案和個性化教育計劃。
IBM正在與多個領先的癌症研究機構合作,加快臨床識別,為患者提供個性化治療方案。它也被認為是短期內最有前途的認知計算應用之一。該計劃旨在減少醫學解讀DNA的時間,瞭解個人遺傳資訊,從醫學文獻蒐集相關資料的時間從幾周變為幾分鐘。由此產生的分析結果使醫生能夠針對任意患者特定的癌基因突變做出診斷。只需幾分鐘,Watson就能完成遺傳物質和醫學文獻的審查過程,產生一份視覺化資料的報告,並以循證醫學為基礎,綜合患者個人獨特的基因提供可行的藥物方案。臨床醫生可以評估這些證據,以確定它的療效是否會比標準方案更有針對性。
前沿認知科學的含義和義務
認知時代(The Cognitive Era)是應用型科學發展的下一步,它幫助人類理解自然並改善人類的生存狀況。在此意義下,它是一個老故事開啟新篇章。圍繞人工智慧的爭論只是其中一個最新的例子,是相信科學進步的人和那些害怕它的人之間古老爭論的延續。與媒體和流行娛樂界的爭論相反,在科學領域,裁決已定。追求認知性未來已成為廣泛共識,人們也普遍認識有必要承擔技術責任。
「技術創造可能性和潛力,但最終,我們的未來將取決於我們做出的選擇。我命在我,不在技術。」
——Erik Brynjolfsson,MIT(麻省理工學院,經濟學著名教授)
具體而言,我們會繼續型塑認知計算對工作和就業的影響。與所有技術一樣,認知計算將改變人們的工作性質。這將有助於我們更快速、更準確地執行一些任務。許多處理過程會更便宜,更有效。某些事,它甚至會比人類做的更好。這也是自文明誕生以來一直髮生的情況:新技術被發現具有更高的價值,它讓我們的社會和生活得以適應和進化。所以,我們有理由相信,此時此刻的情況與以往是一致的。事實上,認知時代會為人類開啟一個知識、發現、機會都以指數級速度增長的世界。我們也有充分的理由相信,人類的工作將變得越來越有趣,也更具有挑戰性和價值。
同時,社會的控制和保障也一樣重要。對於智慧系統的擔憂再一次適用於此。從汽車、藥品到手機,每一項技術的轉換都會涉及個人和機構的安全問題。這些問題已經刻不容緩,也將繼續與認知技術發展如影隨形。這些問題已經被今天激進的技術民主化(網路和雲端的快速傳播是背後的驅動力)以及隨之而來的成本削減所點燃。
我們相信,答案不是試圖限制民主化,而是要擁抱它,同時設計出融合隱私、安全和人工控制的認知系統。
為下一代人類的認知鋪平道路
最後,所有的技術革命不僅是被發現的,而且是由商業和社會需求推動的。我們追求這些新的可能性並不只是因為我們有能力,而是因為我們有所求。
每一項革命性的技術,由於世界的複雜性和我們自己根深蒂固的偏見和方法,我們最初對它們的理解都是有限的。然而,所有的限制必然會被進展所突破。事實上,我們一直在為不知道付出昂貴的代價:我們不知道患者的病因出在哪裡;不知道產品的消費者在哪裡;不知道重要的自然資源藏在在哪裡;不知道每一項的投資風險在哪裡。
「行為明智的最大障礙是無知,它也是恐懼的最大來源。小小的蠟燭會發出誤導性的微弱光線,投射出巨大而不詳的陰影。正午陽光光線明亮,不會投下一絲陰影。是時候將這整個人與機器的難題置於耀眼的正午陽光之下了。計算機永遠不會剝奪人的主動權,也不會取代人類的創造性思維。計算機會把人類從低階的重複性思考中解放出來,讓人類更加充分利用理性,創造更多機會。」
——Thomas Watson Jr. (小托馬斯.沃森,IBM第二代總裁)
在IBM,我們相信,世界上的許多難題終將得到解決。藉助認知計算,我們會實現這一宏偉目標。
炒作「人機大戰」的戲碼會讓我們偏離主題,這些戲碼只存在於那些激動人心卻很具誤導性的小說裡。現在的認知系統不是我們的競爭對手,將來也不會是。科學和經濟學的證據都不支援這種恐懼。真正的認知系統實際是一種深化重要關係的工具——人與世界的關係。
透過它們,我們將為下一代人的認知鋪平道路。我們能用嶄新而有力的方式思考和推理。認知系統是真正靈感源於人類大腦的機器。同樣的,這些機器也會真正激發人的大腦,提高我們的理效能力,改變我們的學習方式。在21世紀,知道所有的答案不能稱得上智慧,但提出更好的問題才算真正的天才。