大模型時代進入尾聲:場景式模型接棒

華爾街科技眼發表於2023-04-20
大模型時代進入尾聲:場景式模型接棒

文/彭藝信

編輯/侯煜

ChatGPT像里科技行業裡的鯰魚,攪動一池春水。自從它出現之後,中國科技企業扎堆釋出AI大模型。

有人嘲諷,ChatGPT在中國即將“畝產過萬”;也有人調侃,下個階段該是“全民大模型,ChatGPT進萬家”了吧;還有人直言, ChatGPT是十月懷胎,中國大模型一個月成型。

中國大模型為何能飛速成型?究竟是養在深閨人未識,還是跟風造概念?阿里雲CTO周靖人說過,動輒超千億引數的大模型研發,不是單一的演算法問題,也不是靠簡單堆積GPU就能實現的。大模型是囊括了底層算力、網路、儲存、大資料、AI框架、AI模型等複雜技術的系統性工程,需要AI-雲端計算的全棧技術能力。

在當下增長乏力的科技網際網路產業生態中,網際網路企業把大模型當做救命草。 不過,儘管市場火熱,但潮退後才能見識真實力。

中國科技圈,大模型的大躍進如火如荼,但在本月初, OpenAI 的 CEO 在演講中警告稱: 我們已經處在大模型時代的尾聲 ,並表示如今的生成式AI (AIGC )發展中,將資料模型進一步做大,塞進更多資料的方式,已經是目前人工智慧發展中最後一項重大進展,並且還聲稱目前還不清楚未來的發展方向如何。

可以預言的是,當下大模型技術對於 AIGC 的發展至關重要,但從長遠來講,AI 的發展絕不會永遠依賴大模型的引數提升和算力的堆砌。未來, 針對更具體的應用場景,開發更小更精準、針對應用場景的模型才是發展的方向。

本文將盤點目前市場上呼聲較高的大模型,中國大模型究竟是曇花一現,還是千錘百煉不斷精進,讓我們持續關注。

OpenAI

大模型時代進入尾聲:場景式模型接棒

2021年11月,OpenAI推出了GPT3.0。它是運用1759億個引數所實現的預訓練語言模型。去年年底ChatGPT問世,該系統釋出後五天內就吸引了超過100萬使用者

ChatGPT是人工智慧技術驅動的自然語言處理工具,其使用的人類反饋的強化學習技術,可以更容易推斷出使用者的意圖,產生更自然和更合理的回答,像人類一樣來聊天交流,完成撰寫影片指令碼、文案、程式碼、論文等任務。

今年2月OpenAl投資人微軟宣佈推出由ChatGPT支援的最新版本人工智慧搜尋引擎Bing(必應)和Edge瀏覽器,到今年3月15日,OpenAI推出GPT-4文字生成AI系統,但僅向Plus付費訂閱使用者及企業和開發者開放。

大模型時代進入尾聲:場景式模型接棒

OpenAI公佈的訓練GPT模型由於訓練過程複雜,資料不透明,加上長期的技術迭代等,其在演算法層和硬體層積累起巨大優勢,外界想要複製ChatGPT並不容易,ChatGPT目前在大模型領域的霸主地位無人能夠撼動,OpenAI市場估值已經達到290億美元,成為世界上估值最高的初創公司。

現在的ChatGPT面對的不只是商業化和監管的壓力,由馬斯克、圖靈獎得主Bengio等千人聯名的“暫停高 級AI研發”的公開信,目前簽名數量已有9000多人,此外,它也受到越來越多的國家的抵制,在其出現的兩個月後,義大利就宣佈禁止使用ChatGPT,原因是認為ChatGPT平臺不安全並且會非法收集大量使用者資訊。

大模型時代進入尾聲:場景式模型接棒

特點:可以直接面向C端使用者群體。

引數量大:ChatGPT-3模型使用了1750億個引數, ChatGPT-4的引數量更大,

迭代快:OpenAI在原本官網產品下拉選單中的ChatGPT已換成了GPT-4。

百度“文心一言”大模型

大模型時代進入尾聲:場景式模型接棒

作為國內人工智慧(AI)領域的旗手,今年3月,百度就推出直接對標ChatGPT的文心一言。

文心一言也擁有文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成的能力。百度文心一言的釋出會後一小時內,排隊申請文心一言企業版 API 呼叫服務測試的企業使用者超 3 萬家,申請產品測試網頁多次被擠爆。

根據後期大量試用的反饋,文心一言也暴露出透過模式和規則來生成文字等問題,對比之下, 業界出現了“百度搶佔大模型市場的心態操之過急”的看法, 也讓大家看到了國內外自然語言處理大模型方面的差距。

大模型時代進入尾聲:場景式模型接棒

事實上百度在大模型領域沉澱已久,百度早在2019年就推出了文心大模型ERNIE 1.0,而目前,ERNIE 3.0每天接受數十億使用者的搜尋請求。文心一言會基於飛槳深度學習平臺和文心知識增強大模型,持續從海量資料和大規模知識中融合學習,具有知識增強、檢索增強和對話增強的技術特色。

已有650家企業夥伴加入文心一言生態,包括小度和自動駕駛Apollo等產品,以及愛奇藝等公司也已經接入百度的文心一言模型。

特點:擁有三級大模型技術體系

形成了“基礎-任務-行業”三級大模型技術體系,擁有NLP、計算機視覺(CV)、跨模態等基礎大模型,以及對話、跨語言、搜尋等任務大模型,還有生物計算領域大模型、各行業大模型及支撐大模型應用的工具平臺。

阿里通義大模型

大模型時代進入尾聲:場景式模型接棒

4月11日,阿里雲智慧技術長周靖人在阿里雲峰會上正式官宣阿里巴巴“通義千問”。

開啟通義千問,是一個聊天對話方塊,與競品相似,通義千問在作為“問答機器人”基礎上還新增了圖片生成應用功能,透過拍照上傳一張功能草圖,便可以自動生成低程式碼業務應用。

大模型時代進入尾聲:場景式模型接棒

實際上,早在2022年9月阿里巴巴達摩院就釋出了“通義”大模型,打造了國內首 個AI統一底座,並且通義M6使用的引數規模超過了ChatGPT,是全球引數規模最大的AI模型。

去年11月阿里還正式提出“Model as a Service”理念,牽頭搭建了國內規模最大的AI模型服務社群“魔塔”,公佈的資料顯示,魔塔社群目前已有超100萬活躍使用者,模型累計下載次數超1600萬,模型總數達800個,與十幾個頂尖人工智慧機構合作。

接下來,阿里所有App,包括天貓、淘寶、釘釘等未來都會接入通義千問,進行全面改造。

通義大模型更偏向為B端服務, 周靖人在峰會上強調,未來每一個企業在阿里雲上既可以呼叫“通義千問”的全部能力,也可以結合企業自己的行業知識和應用場景,訓練自己的企業大模型。在2022年阿里就將AI應用於電力排程,聯合電網研發出高精度電網負荷預測模型,現已在山東德州落地。

特點:服務B端、瞄準企業客戶

商湯“日日新大模型”

大模型時代進入尾聲:場景式模型接棒

在4月10日的商湯技術交流日活動上,商湯“日日新SenseNova”大模型體系正式問世,作為中文大模型,其包含自然語言處理、內容生成、自動化資料標註、自定義模型訓練等多種大模型及能力,商湯還公佈了基於該體系的AI內容生成式平臺——包括秒畫、如影、瓊宇、格物等。

目前商湯在AI領域的投入規模已經超過百億,商湯已打造CV(計算機視覺)、NLP(自然語言處理)、AIGC(人工智慧內容生成)多個AI大模型,歷時五年,商湯一直秉持“模型重在能力而非規模”的看法,在2019年於上海臨港建設的商湯人工智慧計算中心,共有5000P算力,大裝置擁有2.7萬塊GPU晶片卡,實現自供算力以訓練大模型

大模型時代進入尾聲:場景式模型接棒

商湯也釋出了自研類ChatGPT產品“商量”,作為千億級引數的自然語言處理模型,其能夠提供以下功能:程式設計助手,幫助開發者編寫和除錯程式碼;健康諮詢助手,為使用者提供個性化的醫療建議;PDF檔案閱讀助手,能輕鬆從複雜文件中提取和概括資訊等能力, 商湯科技聯合創始人王曉剛則表示“商量”大模型未來主要面向To B端。

此外商湯的大模型研發體系在多種行業場景中落地,比如為政企客戶提供包括視覺感知通用任務與標註服務等多種靈活的API介面和服務,客戶根據實際應用需求呼叫大模型的各種AI技術能力。“日日新SenseNova”應用在智慧駕駛領域,實現了可識別3000類物體的BEV環視通用感知演算法的實車量產,也構建了感知決策一體化的自動駕駛多模態模型,能夠給環境、行為、動機解碼能力帶來突破。

特點:場景式大模型,關注具體的使用場景

Meta

大模型時代進入尾聲:場景式模型接棒

2023年2月25日,作為矽谷三巨頭之一的Meta,在官網公佈了一個新的大型語言模型 LLaMA(Large Language Model Meta AI),Meta提供了70億、130億、330億和650億四種引數規模的 LLaMA 模型,由Meta的FAIR團隊開發,接受了20種語言的訓練。Guillaume Lample 在其Twitter上聲稱:LLaMA130億引數版本的表現,在大多數測試上表現優於GPT-31750億引數版。

為了區別於ChatGPT,Meta執行長馬克·祖克伯表示,LLaMA 模型旨在幫助研究人員推進工作,在生成文字、對話、總結書面材料、證明數學定理或預測蛋白質結構等更復雜的任務方面有很大的前景。

大模型時代進入尾聲:場景式模型接棒

據瞭解,LLaMA 模型也有著其他大語言模型的通病:會產生偏見性、虛假的內容。Meta會向非商用的研究機構開放 LLaMA原始碼,根據具體情況授予學術研究人員訪問許可權,開源吸引來的更多的研究者可以幫助解決這些問題。

除此之外,Meta AI在官網釋出了影像分割大模型SAM,該模型在圖片元素識別與分割上的表現遠超預期。英偉達AI科學家Jim Fan在社交媒體上表示,SAM讓計算機視覺(CV)迎來“GPT-3時刻”,它已經瞭解了物體的一般概念,即使對於未知物件、不熟悉的場景(例如水下影像)和在模稜兩可的情況下也能很好地進行影像分割。

特點:開源、影像識別能力強

谷歌

大模型時代進入尾聲:場景式模型接棒

2023年2月,Google釋出了Bard大模型,這是一款用於對抗ChatGPT、在一個大型語言模型(LLM)基礎上推出的智慧聊天機器人,Bard作為谷歌對話應用語言模型,可以說是LLaMDA的一個輕量和最佳化版本。3月21日,谷歌向公眾開放了Bard的訪問許可權,但目前僅支援年滿18歲的美英使用者註冊試用,且只支援英文提問。

Bard也為使用者提供了一個單獨的聊天介面,從AI功能上來看,Bard跟其他AI模型大同小異,使用者可以在文字框中進行提問和搜尋,比如讓Bard幫你寫一篇文章、列一個計劃、解決一個題目得出結果等。

大模型時代進入尾聲:場景式模型接棒

然而在谷歌短短的幾秒展示裡,Bard就出現了大問題:被問到“我可以告訴我 9 歲的孩子關於詹姆斯·韋伯太空望遠鏡(簡稱JWST)的哪些新發現?”時, Bard的回答裡面有一個巨大的錯誤:回答裡提到“ JWST 拍攝到了太陽系外行星的第一張照片”,事實上,第一張系外行星照片應該是2004年由歐洲南方天文臺的Very Large Telescope拍攝的。

由於有了上線後曾出現的混亂和批評的前車之鑑,現在谷歌Bard整個介面都透露出谷歌滿滿的求生欲。在你開始使用Bard之前,會有一個免責宣告,明確提醒你Bard目前還只處於實驗階段。無論是在提問的文字框下面還是答案生成框下方,時刻都寫著一行小字,提醒使用者“Bard可能生成不準確或者略帶攻擊性的資訊,但並不代表谷歌官方觀點”。

特點:聊天大模型、準確性不佳

360

大模型時代進入尾聲:場景式模型接棒

3月29日,在“2023數字安全與發展高峰論壇”上,周鴻禕現場演示了360自研的人工智慧語言模型在360瀏覽器上的應用,並宣佈了360的人工智慧發展戰略。

360於4月9日公告,基於360GPT大模型開發的人類智慧產品矩陣“360 智慧腦”將落地搜尋場景,面向企業使用者開放內測。據瞭解,企業使用者在PC端360 搜尋首頁申請並獲得測試資格後,可透過企業安全雲體驗使用。未來,360 智腦將與瀏覽器、數字助理、蘇打辦公、智慧營銷等場景應用深度結合,全面提升使用者工作效率。

特點:面向B端

大模型時代進入尾聲:場景式模型接棒

崑崙萬維

崑崙萬維公眾號在4月10日宣佈:由崑崙萬維和奇點智源合作自研的,中 國 第 一個真正實現智慧湧現的國產大語言模型——“天工3.5”釋出在即,並於4月17日啟動邀請測試。

崑崙萬維甚至宣稱“天工”大模型已經非常接近OpenAI ChatGPT的智慧水平。ChatGPT是基於GPT3.5大模型,所以把這個版本命名為“天工3.5”。崑崙萬維研發團隊2020年從一億級模型做起,上升至十億級模型,再到百億級模型,在三年後將研究成果放入大模型之戰,選擇開源的方式入局。

特點:偏向C端的語言大模型


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70023934/viewspace-2947075/,如需轉載,請註明出處,否則將追究法律責任。

相關文章