“盤古”走向產業山巒,開啟了一串AI落地的新腦洞

naojiti發表於2021-09-17

作為中國神話體系中最古老的神,盤古與其他創世神不同的地方,在於開天闢地之後,將自身化為承載華夏文明的山川江海。

《五運歷年紀》中記載,盤古氣成風雲,聲為雷霆,左眼為日,右眼為月,四肢五體為四極五嶽,血液為江河,筋脈為地理,肌肉為田土,發為星辰,皮毛為草木,齒骨為金玉,精髓為珠石,汗流為雨澤。

今天,眾多產業渴望引入AI來提質增效,但傳統行業AI人才不足、專業經驗與技術相互適配的磨合難題、產業智慧化改造的探索成本等等,導致AI落地產業時,很容易面臨需求瑣碎、解決方案繁多、投入效益比不清晰的混沌局面。

這時,預訓練大模型的出現,就成為劈開蒙沌的那把“斧子”。

基於預訓練大模型,開發者和產業可以通過微調就能快速開發出適配不同場景的應用,打破AI落地產業的諸多限制條件。GPT等超大引數通用模型的迭代,都會引發學術界和產業界的狂熱關注。而中國預訓練大模型的技術標杆,大概率要算華為一個。

今年4月,華為雲釋出了盤古系列超大預訓練模型。基於大量資料打造,具有超大規模引數、超高精度的特質,還提供模型預訓練、微調、部署和迭代的功能,以減少行業側的資料標註依賴,從而降低人工智慧開發的門檻和成本。

以“盤古”來命名預訓練大模型,來自於華為嚴肅而又浪漫的思考——為AI走向千行百業開啟新空間,同時將華為的各種技術能力與產業融合,讓AI滋養萬物。

AI落地不是奇思妙想的神話,要經受現實的種種考驗,盤古大模型真的能夠實現技術目標嗎?恰好最近有一個實地探訪“華為雲黑科技”的節目,我們可以通過盤古大模型的探訪視訊,眼見為實地瞭解一下盤古大模型在實際案例中的能力。

可以看到, AI正在與千行百業、山川江海凝結在一起,抵達每一座產業山巒,勾勒出數智山河的全新畫卷。

其中,“盤古”都扮演著怎樣的角色呢?

工業之眼

AI需要望向那些曾被忽視的偏遠角落和產業難題。電網巡檢,正是這樣的地方。

長期以來,電網員工必須穿行在深山峽谷、荒漠戈壁中,親自去觀察和檢修故障。而現在,盤古大模型也讓AI開始流淌在這些人煙罕至的地方。

在國網重慶永川公司智慧電力巡檢專案中,就用無人機替代人力完成巡檢,但是,要當好一線生產作業中的“眼睛”,並不容易。

一來,許多電網環境和狀況都各有不同,意味著訓練資料樣本少,傳統開發方式下很難達到應用效果,無法取代人力;二來,電網作為基礎設施,覆蓋面積大、範圍廣,標註海量資料需要耗費大量時間和人力成本。這時,盤古預訓練大模型的優勢便體現出來了。

首先,盤古CV大模型是目前業界最大的CV大模型,包含超過30億引數,並且在超過10億張影像上進行了預訓練,在ImageNet等資料集上的小樣本分類精度上排名世界第一,所以能夠滿足無人機智慧巡檢系統(缺陷檢測)中的小樣本學習、標註工作量大等問題,提升訓練效率。國網重慶永川專案中,就藉助盤古大模型將資料篩選效率提升30倍、篩選質量提升5倍。

其次,盤古大模型的開發過程中採用了多項領先技術,比如首次在影像預訓練流程中加入生成和判別損失,兼顧CV大模型的判別能力和生成能力,保證模型在底層影像恢復和高層語義理解的能力,從而保證了最終部署的模型精度能夠滿足作業的需求。

不難看出,盤古大模型的視覺能力,正在點亮中國大地上一個個能力各異的“工業之眼”。

醫療之臂

提到AI醫療,很多人都會想到疫情防控期間行走在醫院裡的消毒機器人、送餐機器人。很少有人知道,在實驗室中,科研人員同樣需要AI來加速攻關。

新冠肺炎爆發後,全球的科研人員短期內發表了大量新冠相關的文章,時間緊任務重,要快速從海量文獻中提取出最新最前沿的關鍵知識和研究成果,給中國醫療人員帶來了不小的壓力:

靠人工整合,不僅需要大量人員投入,影響防疫效率,還可能出現分析效率低、出現誤差等情況。而且,當時所能使用的深度學習演算法模型,很多沒有生物醫學領域語料,在知識提取上表現一般。

這時候,盤古大模型迅速化身為科研人員的左膀右臂。

基於盤古大模型,華為雲構建了從文獻到知識圖譜的端到端分析流程,用於醫學資訊的抽取,同時提出了用於醫學關係預測演算法,可以自適應地選擇更恰當的專家模型,來對輸入的資料進行預測。

靈活的模型選擇,使得盤古大模型的知識表徵方法比傳統的知識表徵方法,準確度提升了12%。也有效地推動了科研工作的程式。

可能有讀者會問,隨著疫情逐步得到控制,盤古大模型還能在醫療領域發光發熱嗎?實際上,今天AI及盤古大模型已經成為生物醫療創新路上不可或缺的夥伴。

城市之路

智慧城市是目前為止人類對AI能力最恢弘也最全面的落地想象。而城市智慧生活,則是由一個個細分且垂直的演算法模型來組成的。

舉個例子,城市指揮交通往往需要成百上千個演算法,來分析和處理錯綜複雜的交通狀況與萬級規模視訊流資料。僅識別領域,就包括號牌遮擋、人車對比、駕駛行為異常等等諸多細節。

要針對每個AI落地場景都一一開發、訓練,智慧城市可能要等到天荒地老。這時候,盤古大模型就成了智慧城市的一條“加速履帶”,讓創新可以被更快、更簡單地實現。

這條加速履帶,讓AI應用之路更寬廣:利用自研的虛擬的與現實資料混合技術,配合最新研發的層次化Transformer模組,盤古大模型能夠實時處理數百路視訊的實時資料,在無需任何手工標註資料的情況下,完成交通參與者的識別與分析。這意味著,基於盤古大模型,許多AI能力薄弱的城市也能快速追趕上智慧化隊伍。

同時,也讓數字化建設變得更集約。一直以來,智慧城市都面臨著資料、算力、人才等資源的巨大消耗。而基於盤古的預訓練模型,以及自研的小樣本微調技術等等,可以大幅降低人工標註量和調優難度,讓AI可以低成本、大規模複製。

藉助這條履帶,越來越多的城市可以點亮AI之路,智慧山河的畫卷正在城市版圖上徐徐展開。

科學之腦

盤古大模型不僅出現在人間煙的火、千行百業的實踐中,也不忘護航科研創新的星辰大海。

盤古大模型的分身之一科學計算大模型,正在各種科學問題中,用AI技術來促進基礎科學的發展。

目前,科學計算大模型還被應用於氣象預測、分子動力學預測、微分方程求解等科學問題上,助力AI長遠地影響和改變人類生活品質。

目前,盤古大模型已經在能源、零售、金融、工業、醫療、環境、物流等行業多個場景中成功驗證。透過這些案例,我們可以窺見盤古大模型為AI描畫的想象空間——為產業AI開闢新天地,將己身支撐數智山河的繁榮生長。

在產業山巒間,描畫AI的指數級增長曲線

有資料顯示,目前AI的滲透率不到10%,產業AI處在初級階段,帶來巨大的市場增長空間。多快好省,是AI接下來走出指數級增長曲線不可或缺的環節。從盤古大模型的實踐中,我們也可以看到,加速AI落地產業的幾個前提:

1.標準化。盤古大模型在預訓練階段沉澱了大量的通用知識,四大分身模型以流水線的方式,快速適配和擴充套件不同場景,實現了AI模型在千行百業的批量化落地和可複製性。

2.先進性。只有具備人無我有、降維打擊的技術能力,預訓練模型才能滿足各行各業的差異化開發、訓練需求,這也是盤古大模型的價值所在。比如之前業界的一些預訓練大模型為了追求泛化能力,基本都不調優,導致一些細分場景下無法發揮出最優效能。而盤古大模型的基於提示(prompt-based)調優、動態冰化等一系列技術,則能夠實現小樣本訓練下的優異效能,提升AI的場景普適度。

3.普惠性。減少行業應用者的成本顧慮,也是科技企業的職責。華為雲通過全棧AI協同優化,幫助盤古大模型實現訓練加速,單位位元算力成本最優。從演算法、算力與資料問題,再到與行業知識的結合,盤古大模型正在一步步移除AI向產業世界進發的種種阻礙。

在AI進入萬物的過程中,如何讓落地變得更加順暢、真正解決產業問題?技術與產業,可能需要一個“深情擁抱”。這是科技企業需要擔負的時代之責,也是盤古大模型正在寫就的傳奇故事:

讓技術力量化為三山五嶽、雨露甘霖,支撐千行百業的智慧化升級,在產業土壤中澆灌出千姿百態的AI之花。

9月23日華為全聯接線上大會

華為高階副總裁、華為雲CEO、

消費者雲服務總裁張平安

將在主題演講中

釋出華為雲盤古家族新成員

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2792685/,如需轉載,請註明出處,否則將追究法律責任。

相關文章