TVP尖峰對話李開復&沈春華:AI未來進行式與技術的發展

騰訊雲加社群發表於2022-05-19

image.png

從 1956 年的達特茅斯會議至今,AI 已經走過了近 70 年的歷程。這 70 年間,對於AI 的期待有之,對於 AI 的恐慌有之,資本對於 AI 的追捧此起彼伏,技術人對於 AI 的探索應用也從未停歇。

千禧年時的我們,未曾暢想過移動網際網路的繁盛,2022 年的我們,又該如何暢享未來 20 年的AI 發展程式?AI + 醫療會讓我們活到 100 歲嗎?AI 將如何讓元宇宙變為現實?AI 可以幫人類找到幸福嗎?AI 會加深偏見嗎?AI 會搶走人類的工作嗎?傳統企業是否能享受到 AI 紅利?

5 月 8 日晚,騰訊雲 TVP 尖峰對話創新工場董事長兼執行長、創新工場人工智慧工程院院長、《AI未來進行式》聯合作者李開復;浙江大學教授、騰訊優圖實驗室高階顧問、傑出科學家沈春華;第四正規化副總裁、騰訊雲 TVP 鄭曌擔任主持,邀請了 50 位來自 AI 領域的 CTO 與技術專家參與論壇討論,碰撞出關於 AI 的未來火花。

一、李開復:《AI未來進行式》與技術發展的動向

image.png

(一)《AI 未來進行式》的創作起源

《AI未來進行式》這本書的創作起源主要有兩方面原因,首先我認為 AI 是一個特別重要的技術,每個人都應該去了解它能創造什麼機會,和自己有什麼關聯。父母可以幫助孩子做學習規劃,年輕人可以為自己做職業規劃,然後也會看到未來 AI 可能帶來很多新的工作機會,我希望用講故事的方式,把這本聚焦 AI 技術的科普書籍寫得讓每一個人都能讀懂,目前來看反響還是不錯的,讓很多完全不瞭解 AI 的人大概搞懂了 AI 是什麼意思。

另一方面,我自己作為一個理工科出身的技術人,在本科、博士的時候研究的就是機器學習,我深深地感受到技術人普遍欠缺場景想象力,這也是為什麼 AI 在語音識別、自然語言、計算機視覺這些領域做了近 40 年,卻還在關注類似的問題。很多新的場景落地是需要更有想象力的,所以我也希望用跟科幻作家合作的方式,把故事描述清楚,讓我們這些做技術的人可以看到未來 AI 可能的應用場景,帶來的挑戰,又將如何化解,給大家一些靈感與建議。

所以這次和科幻小說作者陳楸帆合作創作《AI 未來進行式》的兩個重要的目的,一是把難的技術給所有的人講懂;二是希望給一些技術很強,但是場景想象力不是那麼強的理工人,或做 AI的技術人,也讓他們對未來的這種願景和未來的場景能有一些靈感和建議。

(二)AI領域的投資經歷與AI+雲的模式分析

得益於很多投資的經歷,我也在其中學會了一些跨領域的知識,我個人認為 AI 創造的最大價值,一定是和場景的結合。在相關投資經歷中,可以總結出三個 AI 創業的發展階段:第一個是在比較早期的階段時,因為 AI 技術人員很厲害,選擇了先創立公司,再做應用;第二類是在某些領域,AI 已經可以創造很大的價值,比如我們當時投的第四正規化、創新奇智、極飛科技等等,都有非常強的商業應用和落地場景。它們先靠場景落地,之後再做平臺。而今天 AI 已經進入了第三個階段, AI 會和其他的科學交叉,也就是說 AI + Science,AI 可以被用在發明新藥、基因編輯、新材料新能源等方向。《AI 未來進行式》這本書裡包含了這三種方向,比如說在智慧交通、無人駕駛就是一個重要的領域,比如說剛才說的 AI 製藥,AI 在新能源方面的應用,這本書都會涉及,因為我們投資也要關注和了解這些產業領域,所以我們也嘗試在書中描述出這些場景,而我們調研出的趨勢則會給寫作帶來一些新的靈感。

創新工場投資的初創企業大多都會用到雲,很多公司也有跟騰訊雲在內的一些雲廠商合作,在私有云領域嘗試更快速地構建一個 AI 解決方案,這其實是跟雲平臺非常好的結合點。我們也投資了一些幫助雲在算力方面加速的專案,當然包括 AI,也包括普通的 workload,我覺得這也代表了雲的未來會快速提升。一個很有意思的現象是,中國的 AI 技術從創業公司、使用率、產生的價值等方面,並不輸於美國。雖然美國的科研能力更強,但中國的落地成果也並不落後。在雲端計算領域,美國的領先優勢比較大,但中國的成長空間很充足,美國的雲端計算雖然已經完成了部署,但到現在才開始把 AI 能力放進去,而中國的雲端計算已經在做 AI 的解決方案了,這是很有意思的現象。

在《AI 未來進行式》這本書裡沒有描述 AI+雲,不是因為雲端計算不重要,恰恰是因為雲太重要了,它已經成為了必須有的一個平臺型的(技術服務),就像作業系統、資料庫一樣,已經不需要刻意去強調它的重要性。比如在無人駕駛領域中,我們假設的雲和頻寬都比現在大和快很多,包括 5G、6G 發展以後,對於雲上資料調動的挑戰,跟邊緣計算的融合,這些在書中都有描繪。

(三)NLP 技術的發展與應用

《AI未來進行式》書裡有一個「雙雀」的故事章節,在這個故事裡,AI 成為了孩子成長的陪伴助手。在人類老師的主導下,AI 化身為一個長期陪伴的助教角色,將孩子的學習與興趣相結合,變得更有效率與主動性。雖然在 AI 時代,我認為人類老師的教育工作 AI 是替代不了的,但是 AI 可以做很多有益的補充,因此在這樣的場景下,NLP(自然語言處理) 的技術就是其中的關鍵點。

在我大二的時候,我剛開始接觸的第一個 AI 技術就是NLP(自然語言處理)。與早期 NLP 的發展相比,最近幾年很多技術正在發揚光大,深度學習是其中的一個重要核心。我們看到一個很大的突破就是自然語言處理的領域正在用自監督學習的技術去做海量資料的標註,這解決了一個巨大的瓶頸。從這個模型做出來以後,帶來了包括 transformer、GPT3 在內的諸多 NLP 領域的技術突破。

我認為 NLP 在未來三到五年應該會有非常多的發展,一方面是在過去已有的應用,比如語音識別、機器翻譯等方向有更多突破;另一方面是在還沒有發生的場景下得到很多嘗試,比如語音對話型的終極搜尋引擎等等。NLP未來的發展,既會把已有的應用從不可用變成可用,從可用變成好用,也會把過去不可能做的應用變成可能做,這是我們現在重大的投資方向,也非常看好這個領域。

二、沈春華:優圖實驗室與騰訊AI的產業佈局

image.png

(一)優圖實驗室的技術投入

優圖是騰訊旗下最頂級的人工智慧實驗室之一,過去多年一直專注於計算機視覺領域的基礎研究和落地的探索。優圖的 AI 能力,比較具有代表性的有大家耳熟能詳的微信刷臉支付、自動 AI 美顏等等消費網際網路領域的應用;同時,實驗室在工業質檢、金融、教育等產業領域也有非常廣泛的落地。

因為騰訊是做消費網際網路產品起家的,非常擅長洞察使用者的需求,這種能力現在在產業網際網路領域也正在進行驗證。我個人理解 C to B 肯定是產業網際網路非常重要的一環,這個可能也是騰訊獨特的優勢,因為騰訊長於通過聯結器型別的產品如公眾號、小程式、企業微信等等,幫助 B 端夥伴更好地服務下游的客戶。

產業網際網路向縱深發展的過程中,更多考驗的是綜合解決方案的能力,騰訊在這些垂直行業有很多年的深耕和非常多的技術落地的應用場景,在幾個垂直領域也梳理出了一些標準化解決方案,可以得到快速的複製,這是騰訊做 AI 應用和其他公司比最大的優勢。

(二)騰訊如何用AI技術,助力實體經濟發展

一方面,雲和 AI 的深度融合將語音識別、影像識別、NLP 等基礎 AI 能力封裝成了適用不同場景的 API 或工具性軟體,讓 AI 成為各行各業優化生產、提高效率的工具。比如在工業製造領域,騰訊工業雲結合計算機視覺的經典技術,加上雲端 GPU 強大的算力,可以為工廠提供超高準確度的基於 AI 的質檢方案系統,將人工需要二十分鐘才能完成的質檢工作壓縮到幾秒鐘,帶來了質的飛躍,每年能節省數千萬成本。

另一方面,雲和 AI 的深度融合也將非常高深複雜的統計機器學習/深度學習的演算法和理論,轉化成了普通開發者也可以輕鬆呼叫的 API,極大降低了 AI 應用的門檻,讓 AI 成為中小企業和普通開發者都可以輕鬆使用的工具,使得各行各業人才把AI帶到更多的產業落地場景,從而產生更大的經濟和社會價值。

騰訊通過騰訊雲,為各行各業的行業夥伴和開發者提供了數百項 AI 原子能力,覆蓋了機器視覺、NLP、模式識別等眾多領域,打造了面向不同行業場景下的 AI 解決方案,讓更多中小企業可以快速地部署、應用 AI,讓 AI 產生價值,幫助產業進一步數字化發展和轉型升級。

三、AI的價值與技術的雙刃劍

(一)如何看待 AI 的社會價值與意義

李開復:在《AI 未來進行式》這本書裡,我對 AI 的價值採取的是比較有建設性的思考態度。業界對 AI 的負面作用討論已經比較多了,但我個人認為技術本身是中性的,對技術的應用正確與否才是造成不同影響的原因。我們可以看到,從長遠來說 AI 肯定會持續創造巨大的經濟價值,同時能夠更精準、便宜、有效地把事情做好。

同時,AI 也是一把雙刃劍,它可以幫我們省去很多重複性的任務和工作,但在這個過程中必然會有一部分人的工作崗位被 AI 所取代。但從正面的角度來看,當這些工作崗位的取代發生時,也必然會創造一些新的工作機會。我認為 20 年以後會達到一個非常美好的狀態,這個狀態就是人類會有更多的時間去做只有人類能做的事情,符合個人的興趣和能力來做的事情,讓每個人的工作更有趣更滿意。

同時,伴隨著 AI 和其他多種技術的成熟,未來我們有可能將生產的成本降到非常低的程度,這就可能有機會把貧窮和饑荒徹底消滅,這也是一個重大的人類歷史裡程碑。當然,達成這些目標還有很多挑戰,但至少從技術層面來看是有機會的。

雖然目前 AI 的應用還有推薦演算法的資訊繭房效應、隱私保護等等問題,這都是 AI 技術應用後的一些普遍社會現象。不過我認為,一個新技術推出的時候一定會對社會產生衝擊,但最後的解決方法都是技術人發明了新的技術來解決了這些負面影響,今天來聽直播的這批人可能就是未來化解 AI 大部分問題的工作者。

沈春華:AI 理想國到底是什麼樣的,沒有統一的答案,但我相信「科技向善」是其中的一種解讀。AI 最大的價值就是服務於人,服務於社會。

一方面 AI 已經能夠讓社會更便捷,比如 Siri 語音助手、微信刷臉支付,現實生活中已經隨處可見。另一方面 AI 也在攻克社會領域中一些以前解決不了的問題。優圖之前利用 AI 技術協助尋人,幫助很多走失多年的兒童找到了自己的父母。去年,優圖聯合了國家天文臺釋出探星計劃,利用優圖的計算機視覺技術幫助中國天眼 FAST 大大提升了脈衝星的搜尋效率,把以前一年甚至更長時間才能處理完的資料,現在用機器學習的技術可能幾天就處理完了,這是幾個數量級的提升,可以極大加速科學探索的效率。

另外,我自己剛剛開始接觸一點 AI For Science 的研究,比如利用人工智慧的演算法,來做蛋白質序列的分析,據我所知優圖實驗室、以及浙江大學上海高等研究院等機構在這些方向上都取得了比較好的階段性的成果,這都是非常好的例子,我相信我們會看到越來越多這樣的例子。

(二)AI 與醫療的美妙結合

李開復:我們認為從現在到未來的十年,甚至二十年間,醫療都會是一個非常好的投資領域。具體有幾方面原因,一是傳統的醫療行業現在正全方位數字化,包含醫療流程資訊化、可穿戴裝置記錄全程健康資料、以及新技術產生海量生物學資料等帶來的大量資料將成為 AI 的“養料”,產生有價值的演算法,在疾病預警、診斷、治療、監測、長期管理等方面輔助醫生進行診斷和治療。二是醫療不僅僅是海量資料的 practice 和 science,比如每種癌症樣本可能很多醫學院一年也沒有太多,醫療的資料是用來教學的,我們的資料是用來教 AI 的,當教學資料只有很少樣本的情況下,海量資料訓練後的 AI 能力領先性就產生了。三是醫學知識太多了,醫生不可能做到全知全能,他看一個病人能夠了解病人的背景和病例的時間也是有限的,看病的時間更是有限的。

因此,我認為 AI 在醫療行業的優化迭代,的確可以做得更好,但是還要綜合考慮各種利益、道德、法律的問題,所以在落地實際診斷方面,還是會需要更多的磨合和訓練。我認為在診斷方面更易被業界接受的是人機協作模式:以醫生為主,他是 AI 的老闆,AI 協助他做診斷,這樣的話,在醫生的基礎之上,AI只會提高他正確診斷的概率。

從投資的角度看,我們認為其實在醫療行業,做新藥研發是一個非常好的領域,這也與 AI 的目標高度一致。因為在這樣的場景下,人的想法和 AI 的想法是一致的,都是如何用最低成本、最短時間研製一個最有效的新藥,這樣的方向上,做 AI 的技術人群與真正的業務方訴求都是一致的,可以用合力把事情做好。這方面我們也有一些投資的案例在跟。

最後我想講的是,醫療行業背後有很多生物學、化學、製藥等領域人員,他們處於電腦模擬之後、臨床之前的實驗室工作階段,這其實也非常適合 AI 去做。它帶來的價值不是取代了人力成本,更重要的是機器本身可以 24 小時不間斷地做實驗,研發的程式指數級提升。最終 AI 理想的效果是讓新藥研發更快,成本更低,讓很多罕見病,不可醫的病都變得可醫,讓人享受更長久的健康,這是我們可以期待的,也是 AI 能做出的最大且沒有爭議的貢獻。

沈春華:過去這幾年我在澳洲的大學工作的時候,也做了一些醫學影像方面的研究。我非常贊同剛才開復老師提到的一點,就是對醫學影像的從業者來說,AI 的目標,至少從現階段來看,不能取代醫生來看病。所以我們應該去做工具,去幫助醫生去看 X 光、CT 影像,更好更快地輔助醫生做診斷。

AI 本身如果要徹底取代醫生的話,我覺得還有很多的問題要解決。比如說現在的 Deep Learning 演算法的可解釋性。這個可解釋性問題如果不解決的話,沒有人敢直接拿 Deep model 預測出來的診斷給到病人,因為你都不知道演算法的決定是怎麼做出來的。

騰訊有一個醫學影像的團隊開發了一個系統叫做 “騰訊覓影”,這是個通過 AI 輔助診斷新冠肺炎的一個解決方案。這個系統利用患者的 CT 影像,可以在一分鐘或者更短的時間裡給醫生提供一個輔助的診斷結果,從而幫助醫生更準確地來判斷患者肺炎的嚴重程度以及發展過程。

大家都知道一次胸部的 CT 掃面往往可以會產生幾百張的影像,如果完全依靠人眼來看的話,要十幾二十分鐘,現在用 AI 的演算法,可以把醫生的檢查效率提高一個數量級,這樣可以讓患者得到更及時的治療。

所以我個人覺得, AI 是一個用來幫助醫生做快速診斷,提升效率的助手,這可能是未來幾年發展的一個方向。

(三)如何做好科技向善,避免資料隱患雙刃劍?

李開復:資料隱患的這些問題,已經造成了很多人對 AI 的認知是負面多於正面,這是一件很不幸的事情。正如前面所說,AI 確實帶來了一些問題,但也會隨著時間、新技術去化解,包括一些相關法律法規的健全和完善,Web 3.0 把資料還給個人等等方式。這些都是可以探索的方向,而且解決方案並沒有我們想象的那麼難。

比如隱私保護的問題,如何確保資料不被濫用,就涉及到很多隱私計算的演算法,比如聯邦學習。以聯邦學習為代表的隱私演算法,可以讓我們魚與熊掌兼得,既能把資料授權去做訓練,又能確保對訓練模型中的資料構成脫敏的作用,不至於產生隱私問題。

從大資料到推薦演算法,這其中的確產生了很多不好的社會現象,這引出了 AI 領域一個很有趣的題目,我們如何能讓一個目標函式去衡量一個相對長遠、比較困難的事情。商業化落地的 AI 演算法,最大化的是大公司的利益,但我們也應該考慮個人對 AI 千人千面的需求。有沒有可能將個人的需求作為目標函式參考進來,去訓練 AI 的模型,兼顧企業和個人的需求,這是非常值得去思考、突破的技術方向。

而另一點,偏見的問題其實主要來自於資料的不平衡,這些問題是做 AI 的技術人應該警惕的,我們做產品之前要確保資料有合理的覆蓋度、平衡度,除了個人的觀念,也需要有一些工具的提醒校正。這背後涉及到的可解釋性相當困難,一方面我們可以做一些可解釋的機器學習模型,另一方面可以試著對已有的標準模型做可解釋,但不要對結果的精確性、細膩度過於吹毛求疵。

最後我想說的是,我們批評 AI 這麼多,人難道就會做得更好嗎?人會比 AI 更沒有偏見嗎?其實不然,以色列做過一個實驗,法官在午餐之前做出的判決會比午餐之後更苛刻,代表他不爽了以後就不顧工作的公平了。人的偏見是很嚴重的,而且人會隱藏、拒絕承認自己的偏見。AI 是一個客觀、公平、透明、基於資料的領域,所以我們有更大的希望把 AI 做成一個低偏見的決策者,遠遠比人的偏見來得低。我們不要因為外部的力量放大一些個別的案例,但其實我有信心在這四點上都能做得比現在好很多,而且跟人相比做得更好。

(四)對技術人來說,怎麼看待AI技術的兩面性?

沈春華:Deepfake 這樣的技術最早開源出來的時候,有些人用它去替換、生成人臉圖片。現在偽造出來的人臉圖片越來越逼真,已經到了人眼都難以區分真假的地步。這確實會帶來很多風險。這些偽造的圖片、視訊資訊在網路上傳播,會帶來挑戰。Deepfake 實際上是基於過去幾年的 GAN 的技術。

據我所知,至少針對 GAN 生成的影像,即使人眼看不出真假的差別,但對於演算法來說還是能夠捕捉到細微的差別,因為生成的資料和真實的資料之間,它們的分佈存在一個 domain gap。就是說你用大量的資料去訓一個深度學習的判別真假影像的模型,目前是很容易判斷這個影像到底是生成的,還是真實的。至少目前是這樣。

如果說,我們哪一天發明了一個演算法, 不管是基於什麼樣的生成模型,可以是 GAN,可以是別的生成模型,如果說它生成的合成資料,演算法也分辨不出真假。那麼對於深度學習的研究人員來說將是重大的好訊息。為什麼?因為我們現在訓練深度學習模型,比如分類器做識別的模型,往往需要大量的人工標註的資料。如果說模型生成的合成資料和真實的資料之間已經沒有domain gap,資料分佈一模一樣,那麼我們就可以利用這樣的技術去得到大量的訓練資料,不需要去做人工標註了。這將極大降低資料成本。

四、TVP大咖發問:關於AI的那些事兒

(一)傳統企業如何使用AI技術?

李開復:據我觀察,國內很多傳統企業數字化並沒有做得很好,當開始使用 AI 的時候碰到的問題是需要海量的資源和時間先把資料整合好,然後才能進入到 AI 的落地環節。許多傳統企業的企業家或是沒有意識到這樣的挑戰,或是下面的數字化團隊沒有做好資訊同步,最後發現做了很多努力 AI 還是不能起作用。其實資料的儲存、整理、分析是最難的部分,一旦做好了,落地 AI 反而是相對較小的問題。

還有很多其他的挑戰,比如每個行業需求都不一樣,沒法做到一個平臺解決所有行業的問題。我們投資的很多公司目前都還是在做解決方案,從長期來說,我們當然是希望能解決一切問題,但這背後需要很多的時間和技術探索。整體來說,未來五年國內大部分的 AI 應用還是需要一個解決方案提供商,它可以是雲,也可以是垂直的 AI 企業。同時我們仍舊需要繼續探索如何能誕生一個更標準化的 AI 能力或者平臺,可以覆蓋大部分行業場景下的使用者需求。

沈春華:對,我覺得這可以說是所有的雲端計算的提供商他們正在做的一個事情, 目的就是使應用 AI 技術的門檻大大地降低, 然後能夠快速地去鋪開,但是這還有很長的路要走。我相信隨著技術的發展,我們有一天是會達到那一步的,這個過程可能會比較長。

(二)AI 理論與實際應用的區隔

李開復:我覺得其實在深度學習的平臺上還有很大的機會,尤其是考慮到應用的場景的話,其實問題不是在我們沒有發明足夠多的好演算法,而是我們沒有能夠想出方法把它更快引入應用,所以我覺得應用還有很大的紅利空間。

也有人提出,深度學習本身是一個黑盒為主的技術方向,背後的理論基礎不夠強,希望能夠推進,這是可以理解的。也有人提出一些想法,認為深度學習本身能不能像人一樣做可解釋化、可分析地發展,需要有辦法把人腦、人的思維特點與深度學習相結合,產生 1+1>2 的發展,這也是一個方向。我覺得做理論的多參與 AI 是好事,但至少從應用的角度來說,我們現在並不是因為欠缺理論基礎讓我們碰到了應用的瓶頸。

沈春華:我補充一點。我一直在做計算機視覺相關的演算法。我個人理解,不管是計算機視覺也好,還是 NLP 也好,在過去幾年有人覺得深度學習的技術發展是不是到了一個瓶頸了,下面就很難發展了。但是,過去幾年我們看到的是,突然一下子就又出來一個突破性的演算法,帶動整個領域的發展。這樣的例子在過去幾年非常多。這一次的人工智慧發展起來到今天算的話可能也就 10 年時間, 如果從 2012 年 Hinton 的那篇 ImageNet 的圖片分類的論文開始算,剛好 10 年時間。

你看它的發展過程就是從 AlexNet 開始,從各種各樣的卷積神經網路到了一個瓶頸期, 大家都覺得是不是好像沒得做了,發展到了一個瓶頸,突然 Transformer 被發明出來, Transformer 又大大地提升了很多工上的效能。然後剛才提到的 GAN 技術, GAN 到現在也沒幾年時間。GAN這樣的生成模型現在能達到的效果放在短短几年前也是很難想象的:生成模型怎麼能得到這麼漂亮的結果?

三年前 GPT3 技術被發明出來,GPT3 顛覆了過去幾十年的 NLP 的研究成果。我個人覺得 AI遠沒有到天花板,或者是到瓶頸期這樣的程度。AI 這個領域的發展非常快。

分享最後,本場主持人鄭曌感慨良多,他表示李開復老師長期對 AI 領域的研究和探索給了我們非常多新鮮的觀點和視角;沈春華老師作為 AI 領域的頂級學者,也帶領我們領略到人工智慧技術的深度魅力。

五、結語

通往未來的道路從來不是一片坦途,這要求創造未來的這批先驅能夠堅定自己的信念,秉持科技向善的原則去應用並無好壞之分的技術本身。20 年後的 AI 發展將是怎樣的,本次討論所勾勒出的僅僅只是冰山一角,還有更多的場景等待每個從業者去想象、去突破。

TVP 自成立之初,便希望能夠“用科技影響世界”,讓技術普惠大家,踐行科技向善的初心與本心。未來的路上,願我們一路攜手並肩,共同前行。

相關文章