“國產類 ChatGPT ”所存在的差距與挑戰-專家圓桌

達觀資料DataGrand發表於2023-03-27

內容來源:ChatGPT 及大模型專題研討會 

轉載自CSDN稿件

在經歷寒冬、霧霾,甚至大家紛紛看不到希望之際,ChatGPT 猶如一場春雨,給做 AI 甚至 NLP 等研究的人帶來了新的希望。

3 月 11 日,由中國人工智慧學會主辦,中國人工智慧學會 NLP 專委會、真格基金、達觀資料共同承辦,中國信通院雲大所支援的「 ChatGPT 及大模型專題研討會」正式舉行。在圓桌對話環節,來自學術界、產業界及投資界的知名專家學者,就 ChatGPT 引發的新 AI 浪潮、大模型“基礎模型”論、“國產類 ChatGPT ”所存在的差距與挑戰展開高階對話。這些專家有:

  • 中國人工智慧學會副監事長、清華大學教授馬少平

  • 瀾舟科技創始人兼 CEO、CCF 中國計算機協會副理事長周明

  • 中科院自動化所研究員、IEEE/ACL Fellow 宗成慶

  • 真格基金管理合夥人戴雨森

  • 華為人工智慧科學家、北京郵電大學博士楊浩

  • 中國信通院雲端計算與大資料研究所人工智慧部副主任曹峰(擔任主持人)

“國產類 ChatGPT ”所存在的差距與挑戰-專家圓桌


1.ChatGPT 的火爆給 AI 帶來了新希望


主持人(曹峰): ChatGPT 引發火爆關注的原因是什麼?引發繼 AlphaGo 以後又一輪人工智慧的浪潮,究竟有著什麼樣的價值和意義?

馬少平:ChatGPT 能取得成功,個人覺得與這三方面有關係:

  • 第一是意圖理解能力,簡言之就是對問題理解的突破;

  • 第二是語言生成能力;

  • 第三是多輪對話的管理能力;

從 AlphaGo 可以看到 AI 在專用任務上能做得很好,而現在大模型在相對通用的任務,也表現出色,這可能是引起大家特別關注的原因。

周明:在過去幾年,AI 越來越走向寒冬,去年,國內在 AI 領域的投資基本約等於 0,就在大家覺得 滿眼霧霾時,ChatGPT 給人們帶來了希望的光芒,照亮了前進的道路。ChatGPT 的爆火給做 NLP 的人帶來了不少信心,說明沿著這條路是肯定有機會能走出來的。

在一次哈工大的鑑定會上,我曾表示:“自然語言是人工智慧皇 冠上的一顆明珠”。彼時,在場的專家學者覺得這句話對 NLP 在 AI 領域的地位總結的非常精準。所以說,這句話並非出自比爾·蓋茨,但比爾·蓋茨說完後,我們再出去講的時候,就起點作用了。

宗成慶:我認為 ChatGPT 引人關注的原因有兩方面,一是生活角度,如今人手一部或多部手機,大家都喜歡從網上看一些新鮮的東西;其次是從自然語言處理的角度來看,人們在體驗 ChatGPT 的過程中,發現該對話系統生成的句子非常像人話,對比以往的對話系統,ChatGPT 生成的內容的確非常好,效果甚至驚人,而且應用領域也非常廣,不管從什麼樣的領域,包括教育界、法律界、學術界,真正需要的資訊諮詢都會受到影響,影響的社會面非常大。另外,ChatGPT 對使用者的意圖理解非常準確,幾乎能夠準確地把握使用者想問的絕大多數問題。

戴雨森:我覺得主要分為三點:

第一,體驗門檻特別低,普適性強。以前自動駕駛、AlphaGo,如果不下圍棋、不做自動駕駛,人們很難體會到那種神奇。但 ChatGPT,只要是你能說話,就能親身體會,而且可以應用在很多領域,不只是文字續寫或者吟詩作對,具有很強的普適性;

第二,傳播性。可以透過簡單的聊天截圖傳播,大量的截圖滿天飛,讓大家發現它有很多神奇的能力;

第三,它給人的想象空間特別大。因為語言是人類思維的一個載體,甚至是思維本身的體現。大家看到 ChatGPT 後會思考,它對自己行業、工作的影響以及如何提效,這種想象力的空間是非常大的。但每個人看到 ChatGPT 都會產生腦洞,這種腦洞會傳播、會交流,所以帶來更多關注。

楊浩:我這裡補充說明一點,ChatGPT 把 AI 對 toB 的連結轉換成了 toC 端,人人皆可體驗,並且給大家帶來很多信心;第二點是很多人工反饋的資料進入系統,會使這個系統更好的演進,所以這個應用場景是更有意義的。比如我們最近在一些 ICT 的場景,網路裝置運維日誌時,以前假如這個問題不在我的答案裡,回答得看上去傻傻地完全不沾邊;但是現在發現它的整體意圖沒什麼問題,就可能要補一些領域資料,這提升了普通使用者對人工智慧的連線,AI 天花板直接拔高了一大截。



2.多種工作或被 ChatGPT 替代 但也無需神話


主持人(曹峰): 我們看到 ChatGPT 沒有太多行業特色或者行業應用趨勢,大家能否為我們看看未來在 ChatGPT 以及大模型的驅動下,哪些行業是最有可能得到廣泛使用或者可能被顛覆的?

周明:我們公司目前正在做大模型,叫“孟子大模型”,然後我們兩條腿走路,左腿是自己真要訓練出大模型,右腿是我不管從哪兒拿個大模型,網上扒下來的,或者買的 API 也行,怎麼把大模型用好。當然,最後是希望用自己的大模型,自己的大模型用起來之前,最好兩條腿分離一點,不要互相絆住了。

訓練大模型需要智慧,用大模型也需要智慧,而這兩個智慧不一定完全一樣。用大模型的人是站在使用者角度、行業角度,反過來對大模型提出要求。有時候,大模型的人不停地吹捧大模型必須要大才有效果,但那樣是有代價的,大模型也意味著需要太多的伺服器。而使用者的需求可能並不需要這樣的大模型,可能會需要小一點或者弱一點的模型。

首先,如何做好垂直領域的模型,把模型的體積降下來,無需追捧 ChatGPT 這樣全智慧的能力,在各行各業都有很好的應用。比如金融,金融是非常講究降本增效的行業,從客服、營銷、文案合同稽核、智慧投研、智慧投顧、搜尋圖譜,所有的東西會認為都要用到大模型,那麼一個金融機構最好有一個適合於自己各個業務場景的大模型,這個大模型不一定是 175B 的,有可能是 10B 的甚至 1B 的,但是要針對人家的資料和業務場景,用很容易的接入方式,各個業務部門容易接入到這個大模型中,然後快速提供答案和反饋,再不停地迭代,可能3、5天或1、2個月新的資料來了,再迭代。

第二,ChatGPT 講究資料自我封閉,2021 年以後的資料就沒有了,而這也不適用於金融行業,金融行業需要實時,需要一個可以動態訪問金融資料庫的介面,動態訪問各種營銷活動,然後給使用者進行快速推薦等。在落地時,需要把大模型跟所有的業務場景全部開啟,及時、快速、安全,如果這件事情能夠做好的話,金融行業有很多客戶可以展開使用。

其它行業也同樣的道理,因為它都要對很多的認知智慧、自然語言處理理解、問題求解、資料庫訪問、動態跟蹤、客戶推薦,其實都有很多同樣的內容要求的。所以可以把同樣的技術推廣開來,來形成對整個業界的影響力。

宗成慶:哪個行業會首先受到衝擊,其實這個問題不太好具體回答,因為它可以用到任何一個領域、任何一個行業,都可能會受到衝擊。其實最容易被衝擊的,是 NLP 研究的人,ChatGPT 一出來,有很多人問我:ChatGPT 做得這麼好,你們做 NLP 研究還有什麼用?我自己當然不擔心失業,一方面 ChatGPT 還沒有好到沒有問題可研究的地步;另一方面,任何中低端的重複性強的工作被 AI 技術替代,這是不可逆轉的趨勢。

戴雨森:我有一些小總結:

第一,它是“超級縫合怪”。我們所從事的工作中,有 95% 以上可能都是在做“縫合怪”的事情,比如設計師乾的很多事情是把已有的東西縫合在一起,程式設計師是把已經寫過的程式碼元件縫合在一起,作家是把已經有的很多語料縫合在一起。當生成式模型變得很強大時,未來大家更在意原創東西的價值,要真正原創出 AI 裡沒有的東西,因為語言模型、擴散模型可以瞬間把全人類已經有的東西縫合在一起,所以第一個問題是“超級縫合怪”的出現導致原創思維特別重要。

第二個,它是超級介面。以前人要適應機器,我們去操作電腦、PC、手機,人類要服從計算機的正規化,鍵盤、滑鼠或者觸控式螢幕。但是人最核心的互動其實是語言,每個人都會用語言交流,但是之前跟 Siri 等無法實現真正的自然語言交流,因為卡在語義理解、多輪對話等很多地方,但 ChatGPT 出現後,讓我們看到人和機器能夠真正交流,不用人更多服從於機器的正規化,而是機器更多服從於人的正規化。

第三個,超級陪伴。我們在生活中對別人的價值很多時候體現在語言上,現在有陪玩、陪聊,甚至我們從沒見過的一個人。最近兩年,“元宇宙”的概念很火,但後來發現元宇宙沒有意思,因為元宇宙裡面沒有人,元宇宙是荒蕪的。之前大家覺得 Meta human 可能是長得像人,但是實際上最重要的是它要能夠像人一樣去溝通。所以有人看到 ChatGPT 的聊天記錄以後被震驚了,因為在這個過程中看到機器越來越像人,或者越來越難以被區分,這是圖靈測試的意義。

在遊戲、社交或者針對老年人和小孩的陪護裡,人所起到的陪伴性價值演的陪護是能夠被替代或者部分被替代,這是之前技術沒有實現的目標,現在我們看到了可能的趨勢。當然,可能這個腦洞比較大,但是從投資機構的角度來講,至少 ChatGPT 讓我們從以前的不可能,到現在的可能。

楊浩:我覺得接下來被替代的一個肯定是乾重復工作的。但是從正面角度來看,只要不停學新的東西,並且嘗試做“dirty work”,我們都是看到好的,你找到幾個 ChatGPT 不好的 case 了嗎?你發現它的不好了嗎?它不好在哪個地方?可能的原因是什麼?你真的去嘗試一下。

現在國內確實有個瓶頸,ChatGPT 帶來的算力的瓶頸非常高,真正有能力復現這個模型的人、真正去看問題的人,其實難度很大。那麼如何找周圍的資源,產學研一起合作,去搭建環境,去分析裡面的不好案例是一個很大的突破點。而不是別人說好,你也說好,那你就被淘汰了。別人說好,你找到不好,然後分析這個不好,那就取得更大的突破了。

馬少平:對於這個問題,因為我一直在學校,所以相對來說對應用瞭解得比較少。我想從一個原則來說,就是人工智慧的應用原則,我想這個應該是一樣的原則:

第一,它萬一出現什麼大的錯誤,對我這個系統不會帶來什麼傷害,剛開始 ChatGPT 出來的時候,人家問我有什麼應用,我第一個想到的就是陪老人聊天,聊錯了也沒關係,哪個電影的主演說錯了也關係不大,或者跟遊戲有關的,錯了也沒什麼事。

第二個,它作為輔助可以提供一些決策或者幾個方案,最終的決策者還是靠使用者自己。我當時舉的例子是就像輸入法,輸入法輸入一串拼音,它給你若干個選擇,最終是哪個字,由你自己選擇,這樣的輸入法才能用。如果輸入法把這句話自動輸入進去,沒有給你選擇權,這個輸入法用不了。所以它只是輔助,然後最終決策是靠人在決策。

第三個,具體應用中允許一定的誤差,但是這個誤差的多少由你自己定,是千分之一還是萬分之一,只要在你的原則之內就可以。比如過去出版業精品的水平也就萬分之一的錯誤,包括生產線上產品檢測,只要能滿足錯誤率就可以。

具體應用時,第一,滿足不滿足這些原則,第二,不滿足的話,是否有辦法或者利用其他知識使其滿足。



3.當下大模型還沒達到“基礎模型”狀態


主持人(曹峰): 我們也看到李飛飛等科學家把大模型一開始叫“基礎模型”,請問幾位專家,怎麼理解它從“大模型”到“基礎模型”這個概念理念上的變化?第二,如果它真正成為基礎以後,對技術研發、產業應用、行業推廣有其他變化嗎?

楊浩:我覺得有兩點:

第一點,作為基礎模型形成一定的正規化,或者現在所有的人工智慧模型基本都基於 Transformer,應用的開放瓶頸大幅度降低,推動業界發展。相當於大家學習時把小學變成六年,然後初中三年、高中三年,這個規範化的操作,產生更大的價值。

第二點,它推動上下游行業的提升。比如大家比較關心華為的晶片,在這上面也有一些探索,面向特定演算法,在 GPU 和 CPU 之間資料互動時能耗大幅度降低,典型的兩個應用,一個是手機續航更長,二是算起來更快、不發燙,所以演算法不是越便宜越好,而是越好用越好。有時商業上的很多產品沒有學術界產品做得那麼精緻、那麼好,但是就是因為它簡單好用。

戴雨森:從我們做投資的角度,覺得有一個基礎應用之後就可以做應用和中間層了,這是我們的一個直觀感受,這是一個很學術的定義。

比如一個 AI 公司得從頭訓練自己的模型,然後在裡面做垂直整合。今天 ChatGPT 和 OpenAI 很好的做到了 API 化,大家可以很好很快的應用,但不需要自己訓練模型,只要調動它的能力就可以。這樣帶來技術積木化、樂高化的過程,有了這個底座之後可以在上面搭應用,這樣對應用場景特別有幫助。

之前大家在學術階段,現在真正進入到應用、商業階段,這是我對“基礎”的理解,是從學術角度的認知。

宗成慶:這裡的“基礎模型”是基於網上公開的通用的常識性公開資料訓練出來的,類似於一個全科醫生,什麼都可以幹,有頭疼感冒了找醫生開個藥都可以。但是真正用的時候,還得是專科醫生去解決問題,尤其是對於一些需要很深專業知識的領域。

周明:我對基礎模型有不同的看法,雖然是李飛飛兩年前提出來,那時候 ChatGPT 還沒有,GPT3 剛出來,所以大家都覺得全世界 N 個基礎模型,理想是我們一些牛的大公司把它建好了之後,就跟中國電力一樣,這些村就別建自己的水電廠了,大家在我的基礎上壘新的應用,想法其實挺好的。

其實到目前為止,即使是 ChatGPT,也不敢稱之為是“基礎模型”,我給大家講如下幾個觀點:

首先,基礎模型應該是什麼?我覺得至少要滿足以下幾點:

  • 功能比較強大;

  • 穩定的:比如像電力,不能老停電,否則誰也不敢用;

  • 安全的:任何一個人用,不至於傷害其他人;

  • 合乎倫理道德的:現在 ChatGPT 有很多地方不符合倫理道德。甚至可能符合美國的倫理道德,不符合中國的倫理道德;

  • 還有速度、併發、及時更新等很多地方;

  • 對垂直領域的綜合支援;

  • 對使用者無程式碼程式設計各方面的支援。

我個人認為,現在沒有一個模型達到基礎模型的狀態,所以大家不要迷信 ChatGPT,離李飛飛提出的偉大的理想差得遠了。

第二,基礎模型確實重要。任何一個國家,像中國這麼大的國家,有獨特的五千年文化,一定要建立自己的基礎模型體系,來實現安全性、併發性等一大堆東西。當下這件事還沒有人給你一個定論怎麼做,只能靠自己去探索出一套適合於自己國情和市場的基礎模型,這是萬里長征的第一步。也許從今天再搞 10 年、20 年,才能大概形成一個大家都可以放心、穩定應用的一組基礎模型,而不是一個。

馬少平:我很同意周老師的觀點,我們國家至少得有自己的基礎模型。從長遠來說,它可能確實某種程度上發展成為一個基礎設施,這個基礎設施就像電力一樣,電力不能靠國外,像以前沒有石油的時候得找自己的大慶油田。



4.從追趕到超越,首先得學會平視 OpenAI


主持人(曹峰): 最後一個問題,這次 ChatGPT 的誕生,也能看到我們國家跟國外的差距,想請各位專家聊聊我們國家的 ChatGPT 或者大模型目前發展到了什麼地 步?目前有什麼困難?在座有做技術的,有做產業的,也可能是學生,各位分享一下對大家未來的發展建議。

周明:現在是對科技界年輕人、NLP 界一個非常好的階段,我們這些人都是從事自然語言 30 年以上了,過去簡直篳路藍縷,什麼都沒有,程式碼要一行一行寫,滿眼都是淚,沒有一個人支援。

但是今天有大資料、算力的支援,ChatGPT 驗證了可行性。而我們強調自主智慧財產權,所以美國做得再好,也跟我們沒關係,我們仍然有廣闊的天地去開闊。

所以分享一句寄語給在座的各位,包括投資界、工業界、研究界的朋友們,未來的路還很長!選對了路,勇敢地走下去,就是你的計劃!

宗成慶:有人問得更直觀,為什麼中國沒有做出 ChatGPT 來?我說,任何一個高新技術都可以拿過來這樣問,譬如,為什麼中國沒有做出自己的高階晶片?為什麼中國沒有作業系統?為什麼中國沒有自己的資料庫?我們承認和美國的差距是有的,但我個人認為,自然語言處理這個方向比起其他領域,跟美國的差距要小得多,而且自然語言處理領域在近幾年的進步非常大。

當然,原創性的技術是人家的,我們承認這個。從市場應用角度來講,自然語言處理在中國市場並不落後,包括與美國相比。我們已經有了長足的進步,所以非常有信心做好中國自己的事情。

關鍵是我們怎麼做好?現在的大家太浮躁了,ChatGPT 出來以後,全中國從上到下都在炒這個事情,為什麼沒有人去炒區塊鏈、元宇宙了?馬上一下子都轉到 ChatGPT 類研究了。我們應該冷靜去思考當下能做什麼、什麼可以做得更好,不要天天炒那些概念。面向國家需求紮紮實實地做好我們該做的事情才是硬道理。

戴雨森:我想分享幾個看法:

第一,投資是個貝葉斯的過程,對世界的認知肯定隨著我們對資訊的獲取而發生變化。在 iPhone 出來之前,投移動網際網路和做移動開發的都沒戲,當 iPhone 出來後,大家就都投,所以短時間內有浮躁、泡沫、很大的聲量是正常的,因為我們對世界的認知、對未來的預估發生很大變化,這很正常,但是我們希望泡沫下面是有啤酒的。我們看到這次技術變革帶來了很直接的應用價值,在美國看到了不僅是亞馬遜本身,很多已經獲得明顯的商業化結果,所以我相信這波趨勢會很持久,也會很漫長。

第二,要學習趕超 OpenAI,首先要平視 OpenAI。這幾個月聽到的觀點分為兩派,一是神化 OpenAI,覺得 OpenAI 很遙遠,我們在語料、晶片、演算法上都有短板,我們可能做不出來。另一個是速勝論,我們不僅有,而且還有很多這方面的研究,這個月就可以實現甚至是超越 ChatGPT 。

我們從追趕到超越的過程中,我們一開始需要給國產大模型一些時間,首先,我們自己的自然語言模型差距並不大,其次,它不是完全需要非常完美的技術,80 分的模型、90 分的模型、100 分的模型皆有用處,現在我們看到語言模型過一個了閾值,讓它能夠在很多地方產生作用。我們最近也用了 4、5 個團隊的 ChatGPT 產品,雖然有差距,但比之前的嘗試要好一些,部分應用已經做起來了。像湧現的能力、思維鏈等等逐漸開始具備,甚至有的在中文任務上比 ChatGPT 做得好,跟語料和演算法有關。

我們現在面臨的是一個代溝,而不是跨越不了的鴻溝。我們對未來充滿了期待,但肯定這不是一個很快就能見效的事情。我們做天使投資的週期就是 10 年以上長週期投資的,而不是炒股票。

楊浩:說三點關於我自己對 ChatGPT 的想法:

第一點,從垂直領域比較來看,例如機器翻譯,發現 ChatGPT 是不如目前專門訓練的機器翻譯模型;

第二點,我們一直在做質量評估這個事,但是坦誠地說,相對於專業的譯員,還有很大的發揮空間,所以我們還有很多機會去做,同樣 ChatGPT 也沒有解決,所以無需神話它;

第三點是科技向善,ChatGPT 會帶動整體上下游以及晶片的思考,我們公司有個“M+D”的生態,Mindspore 深度學習平臺。現在大家用 Tensorflow 不多了,Pytorch 比較多,但在真正工業落地上有很多問題。D 是指 D 晶片相關內容,我們有些晶片的價格是對方的四分之一,但是整體效能是它的二分之一,這時候把這批晶片做上去的時候是能有收益的。另外再補充下大模型,華為盤古大模型一開始是基於 D 晶片訓練,不完全是基於 GPU ,所以這裡面空間很大。

路會越走越寬,相信那些割裂社會、把技術卡斷的只是少數人,大家在透過產學研甚至和國內外專家親密合作的情況下,這條路是越走越寬的。

PS:想觀看本次研討會的小夥伴可以移步「達觀資料影片號」檢視直播回放。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2941965/,如需轉載,請註明出處,否則將追究法律責任。

相關文章