運營商AI機遇:以大模型擴充全新賽道

naojiti發表於2022-07-20

東數西算正在成為各行業的普遍機遇,對於運營商來說也是如此。

東數西算帶來了全新的算力網路建設需求,以及各行業普遍的網路升級需求。在這一大背景下,運營商還需要一系列細分的價值節點來推動業務進步,開啟市場空間。換言之,東數西算的路有了,運營商接下來更需要關注路上跑哪些車。

在東數西算的整體架構中,AI預訓練大模型的價值值得關注。近年來,大模型可謂AI領域最受關注的方向。高魯棒性的模型效果,卓越的資料集表現,以及跨模態等領域的不可替代性,讓大模型成為產業界與學界共同關注的物件。一時間,“煉大模型”成為了AI產業的共同需求,為此也衍生出配套產業的全新機遇。

大模型的算力要求非常嚴苛,並且需要一系列軟硬體基礎設施的支撐,比如基於昇騰AI的人工智慧計算中心。不過,單個的計算中心之間算力供給存在差異,因此在東數西算的背景下,將東部算力需求有序引導到西部,最佳化資料中心建設佈局,促進東西部協同聯動,能更好地促進大模型產業發展。

對於運營商來說大模型帶來了一系列全新的AI市場空間。運營商幫助大模型進行跨地域訓練,完成算力資源適配,構成了新的服務機會;而運營商本身運用大模型,也可以提升服務能力與產業效率。

運營商的新賽道:大模型訓練帶來的市場想象力

OpenAI在2018年釋出了一份著名的調查報告,從2012年開始,全球AI算力在六年間增長了30萬倍,並且還在持續增長。而當大模型時代正式到來,全球AI算力需求進一步加大。AI算力成為了限制產業智慧化發展的主要挑戰。

2018年,谷歌釋出了NLP領域的預訓練模型Bert,其優越的能力快速得到業界認可。OpenAI打造的GPT-3在多項任務中實現了跨越級的表現,推動全球大模型迎來了爆發式的發展,模型引數呈現了指數級的增長。“大資料+大模型”成為了AI產業最受重視的發展之路。

但在實踐過程裡,我們卻可以發現大模型在訓練與部署中存在著諸多挑戰。比如部署場景中存在的模型效能不足問題;不同場景下大模型的泛化能力不強;預訓練大模型引數多、計算量大,訓練成本高企等等。其中,如何低成本、高效率地完成大模型訓練,成為首先需要解決的問題。在這種背景下,將大模型在東數西算背景體系下進行模型訓練,正在成為越來越多企業與學術機構的選擇。

比如中國科學院自動化研究所在 2021 世界人工智慧大會上釋出了跨模態通用人工智慧平臺——“紫東.太初”。其依託面向超大規模的高效分散式訓練框架,構建了具有效能優良的中文預訓練模型、語音預訓練模型和視覺預訓練模型,並開拓性地透過跨模態語義關聯實現了“視覺-文字-語音”三模態統一表示,構建了三模態預訓練大模型,賦予跨模態通用人工智慧平臺多種核心能力。從應用層面上看,“紫東.太初”兼具跨模態理解和生成能力,在“以圖生音”和“以音生圖”等方向上具有廣泛的應用空間,可以實現AI為影片配音、AI語音播報、AI海報創作等應用場景。

2022年,千博資訊基於昇騰AI和昇思MindSpore AI框架,利用“紫東.太初”三模態大模型,打造了手語教考一體機,開創性地實現手語動作與示意圖片和文字的聯動。目前,該一體機已在湖南數十個學校陸續上線,一定程度上緩解了手語師資短缺問題,帶來了重要的社會價值。

而在“紫東.太初”大模型的訓練過程中,就非常能夠展現出東數西算背景下,大模型進行“東數西訓”的典型邏輯。這一模型由中科院自動化所相關團隊主導,基於昇騰AI基礎軟硬體平臺,在武漢人工智慧計算中心完成訓練。可以說提前替更多大模型嘗試了“東部資料-中西部算力訓練-東部應用”的產學研結合方式。

以此為案例,我們可以看到運營商的AI新市場正在快速開啟。而能夠讓運營商服務大模型的新市場開啟,產業底座的完善性至關重要。

昇騰底座:為運營商AI賽道保駕護航

大模型走上“東數西訓”之路,有幾個必要的產業條件:演算法、資料、算力、訓練所需的軟硬體基礎設施、算力網路。

從目前階段來看,大模型的訓練演算法已經日益完善,國際與國內的大模型訓練基礎門檻不斷降低。接下來是資料,東部地區的企業、高校、科研機構積累了豐富的資料,可以有效投入大模型的訓練當中。這也是中國在大模型之路上雖然後起,卻能夠奮起直追的原因。

接下來是算力,隨著各地人工智慧計算中心拔地而起,以叢集化、集中化的AI算力來完成大模型訓練,已經成為可能。昇騰AI提供的AI算力體系,既可以作為人工智慧計算中心的建設基礎,也可以透過多種方式賦能產學研各界,帶來充沛、完整的AI算力供給。

而在軟硬體配套設施層面,昇騰AI基礎軟硬體平臺,包括Atlas系列硬體和夥伴硬體、異構計算架構CANN、全場景AI框架昇思MindSpore、昇騰應用使能MindX、全流程開發工具鏈MindStudio 和一站式AI開發平臺ModelArts等。為了能夠滿足越來越多企業與學術機構的大模型訓練需求,昇騰AI已經打造了大模型的全流程使能體系。該體系包含從大模型規劃、大模型開發到大模型產業化的全流程,可以實現端到端加速大模型產業落地。

我們可以看到,在大模型的需求與基礎技術崛起後,以昇騰AI為代表的規模化、產業化AI基座已經走向完善。大模型不但是能訓,更加走上了簡單、高效、低門檻可訓的新週期。

大模型的最後一個關鍵需求就是網路與網路配套服務,而這可以成為運營商的重大機遇。可以說,昇騰為運營商的AI賽道起到了保駕護航的價值。

以AI擴充未來:運營商創新正當時

AI技術在運營商業務版圖中的重要性正在不斷上升。早在2020年,Omdia的ICT-Enterprise Insights就公佈了一項調查資料,有近80%的全新運營商認為使用AI技術是一項“重要”或“非常重要”的IT專案,其中近60%的運營商計劃增加對AI工具的投資。

我們可以看到,如今在運營商使用AI、應用AI的場景與價值已經非常廣泛。比如面對5G網路複雜的運維管理需求,主流運營商都已經使用AI技術來實現網路的智慧分析、實時預測和自動化運維。在智慧客服與智慧外呼平臺中,NLP與多輪對話技術已經成為提升運營商服務觸達效率的關鍵。AI技術也是運營商專網服務等新模式的重要助力,比如在冬奧期間,中國聯通就透過AI、雲端計算、區塊鏈技術與5G結合,護航智慧冬奧。與此同時,運營商在AI技術上的投入與建設水準也在不斷加強。

在這個大背景下,用好AI技術,以及服務客戶用好AI技術都成為運營商的關鍵需求。而昇騰底座恰好可以為運營商帶來廣泛且關鍵的支撐作用。比如說,浙江移動就依託九天平臺+昇騰底座,構建了全棧自主創新的行業AI賦能試驗平臺,提供面向行業的人工智慧基礎設施,可實現資料賦能、演算法賦能、應用賦能。該平臺預置了900+演算法和800+預訓練模型,可快速定製演算法模型,以滿足城市多樣化的場景應用需求。透過開放標準化介面,模組化方案組合,為城市管理提供多場景的AI服務,全力推進算力成為像水電一樣“一點接入,即用即取”的公共服務。

面向未來,我們可以看到更行業、產學研各界都在湧現出大模型的訓練與部署需求。進一步來看,大模型屬於產業級AI能力與應用的一部分。除了一般意義上的預訓練大模型,還有更多重度AI模型、AI能力需要踐行跨地域的訓練。

與此同時,運營商本身也是大模型與重型AI能力的需求主體。5月16日,浙江移動在電信日釋出的 “杭小憶”就是基於“紫東.太初”,疊加杭州特色景點——南宋御街的場景,進行高效的本地化增量訓練打造而成的文旅數智人。

面向未來,會有越來越多的大模型踏上東數西算之路。不久之前,“中國算力網-智算網路”正式上線,這是中國算力網路建設邁出的重要一步。接下來,會有包括大模型在內的大量AI任務在算力網路中完成訓練與部署。而運營商可以在算力網路的基礎上,共同參與建設算力網路統一大市場,實現全程全網的社會級算力服務,這對於運營商來說是一個巨大機遇。運營商既可以成為算力網路建設的主力軍,也將從AI帶來的網路增量中主要獲益。

這些趨勢與變化,正在構成運營商的全新賽道。大模型訓練帶來網路需求增加,配套網路服務更加複雜。這些特點都可以為運營商帶來極高的價值增量,並且助力開啟東數西算大背景下的連續性市場空間。

大模型的產業紀元面前,運營商手中掌握著大模型產業化的最後一塊拼圖。運營商關注、發力這一市場,也有助於大模型走向規模化應用與產業級繁榮。

未來,大模型訓練者、昇騰AI、運營商與產業需求的“四方聯動”,將構成一個高效率、低門檻的產業正規化,推動AI黃金時代的到來。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2906824/,如需轉載,請註明出處,否則將追究法律責任。

相關文章