知識計算:華為雲要給AI時代開一扇門

naojiti發表於2021-10-21

在企業、行業應用AI時,我們一般都會說需要具備三大條件:算力、演算法、資料。而企業在獲取這三大要素過程中的難題,也被稱為AI的“三座大山”。

但可能很多人不知道,除了“三座大山”之外,還有一個困擾企業應用AI的難題,叫做——知識。我們總是說,AI需要與行業Know-How結合,需要與行業特性相融,需要掌握幫助企業降本增效的具體方法。這些提法最終都指向AI需要與行業知識結合,才能在商業世界中產生真正的價值。

或許可以說,知識是企業與AI之間的軸承和聯結器,是整個產業智慧化系統中必不可少的一部分。

但也正由於“知識”這個概念的特殊性和差異化,AI與行業知識結合是AI產業化命題中最抽象,也最難標準化的一項。可以說,擺在企業應用AI面前的除了“三座大山”,還有一道“知識之牆”。

近兩年,AI產業的一大變化就是越來越多的研究力量、產品力量,開始向“知識”這個神祕且複雜的領域進發,嘗試在這道AI之牆上開啟一扇門。

而如果你對AI感興趣,應該會知道其中一個代表性方案:2020年9月,在華為全聯接2020上,華為雲釋出了知識計算解決方案,這被稱為業界首個全生命週期知識計算解決方案,填補了一片非常重要的產業空白。

時至如今,知識計算的落地案例不斷豐富,這個產業方向背後的故事也被更多披露出來。我們希望跟大家一起探索這樣一個故事:面對抽象莫測的知識,繁雜多元的行業,知識計算究竟是如何聚沙成塔,完成這個特殊領域的產業落地與標準化方案推出的。

有這麼一群人,當他們面向AI產業的“知識之牆”時,沒有選擇嘆息或者回頭,而是要開啟一扇門。

知識牆:AI落地的巨大挑戰

從上世紀70年代專家系統興起以來,AI的商業化需求始終與行業知識、專業知識緊密相連。但直到今天,行業知識智慧化這個根本需求也沒有得到很好滿足。這也直接導致了AI在傳統行業、實體經濟中的滲透率始終難以提升。

事實上,AI與行業知識的結合經歷了漫長的產業化探索。從邏輯機到專家系統,再到目前依舊盛行的行業知識圖譜,種種方案都存在根本性的問題。比如說,傳統的企業知識圖譜方案缺乏標準化、統一的構建流程。每個方案差異化巨大,耗時漫長,並且缺乏可驗證的應用價值檢測。企業既缺乏動力去推動,也很難在長期使用中獲得持續價值。

另一方面,行業知識圖譜主要還是以一個資料集的方式呈現,價值在於查詢答案,但缺乏自動化、智慧化的能力去解決問題。企業真正需要的往往不是去查詢知識,而是讓知識系統給出進一步的運算結果。這就需要AI+知識系統擁有“可執行”“可計算”的能力。

因此,真正想要讓行業知識與AI結合,成為各行業、企業能夠普遍應用的產業底座,就需要一套整體的方法、技術、工具,幫助解決企業從獲取知識、轉化知識、獲得智慧化價值的全流程問題。

而這裡面就涉及幾個方面的技術難點。

首先,行業知識的真正存在形式,是行業技巧、專家經驗,以及大量口傳耳授的心得。這些內容之間不一定有著緊密關聯,也缺乏統一邏輯。但如果想要讓AI擁有行業經驗,就必須把這些碎片化、非結構化的內容轉化為數學語言,變成AI可以聽懂、能夠踐行的資料化路徑。

其次,AI應用行業知識來創造價值本身還是新生事物。這裡涉及大量實踐性挑戰,比如模型泛化能力、模型可解釋性等問題。想要在知識領域獲得突破,還需要一系列AI模型本身的優化與升級。

此外,AI與行業知識的結合落地,還受到行業場景、組織流程、企業生產方式等一系列外在的、非技術因素的條件制約。AI+行業知識能否落地,很大程度上取決於行業生態本身的智慧化升級空間與技術獲取能力。

知識的挑戰、AI的挑戰、行業的挑戰,三大難題讓這道“知識牆”難以突破。而就是面對這樣一個現狀,華為雲的AI人決定試一試。

開門者:推開知識計算的新路

2018年,袁晶博士加入華為雲。袁晶博士是一名在AI學術界和產業界的跨界專家,曾在頂級國際期刊會議上發表80餘篇論文,並多次獲得最佳論文獎項。2020年,袁晶博士獲得了ACM SIGSPATIAL十年影響力論文榮譽獎;2021年,他獲得了SIGKDD China 時間驗證獎(Test of Time Award)。

在雲端計算產業中,華為雲有一個鮮明的標籤,就是一手抓新技術,一手抓商業落地。以二者之間的強聯接作為一大產業特色,這也是華為雲吸引袁晶博士的一個特點。

來到華為雲之後,袁晶博士同時負責AI演算法、技術研究創新團隊和AI面向行業的產品商業化團隊,這讓他和他的團隊有意識地去審視行業真正需要的是什麼,從而全流程參與AI技術的落地閉環。

就是這樣一個具有突破以往領域限制的自由度,讓袁晶博士團隊看到了行業知識與AI結合的必要性與緊迫性。相比於傳統的行業知識突破、資料獲取等碎片化服務,團隊認為當務之急是構建整體性的、囊括一系列工具與能力、能夠實現全週期行業知識與AI結合的方案。

在這一過程中,袁晶博士與團隊在NLP、多模態等領域的前沿技術視野與能力成為關鍵推力之一,構成了“AI+行業知識”中“AI技術”的那一面。例如在2021年,袁晶博士團隊就有多篇論文被ACL 2021,CVPR2021等頂會接收,並且獲得CCKS篇章級事件抽取技術評測冠軍、國際權威WSDM CUP大賽金牌等。

另一方面,華為雲已經在多個行業中實踐了超過600個AI專案,從而積累了大量的行業需求、行業經驗,這些實踐經驗構成了“知識”的那一面。

“AI技術”和“知識”二者相遇,讓華為雲有了推動一個全新方向的可能性。雖然前途依舊充滿挑戰,但至少有了打破僵局的機會。

一系列的研發、產品化與行業融合實踐之後,“知識計算”解決方案終於在2020年正式釋出,共包括四個方面的技術能力與產品服務:

首先是知識獲取,通過對多模態的行業知識,比如生產系統中的機理模型、專家經驗進行解析和處理,完成由現實經驗向數學模型轉化的第一步。

之後是知識建模,根據業務場景的具體需求,向客戶提供方便快捷的知識建模工具,比如流水線式的自動化知識圖譜,極大縮短行業知識圖譜的構建時間,並且實現圖譜的自動更新。

繼而是知識管理,讓使用者獲得行業知識的儲存和高效能查詢能力,並且實現自動化更新、衝突管理等功能。

最後在知識應用層面,華為雲可以提供知識搜尋、視覺化分析、知識推薦等基礎能力,以及智慧對話、預測分析、知識推理等高階能力。這些能力介面將華為雲多元化的技術向企業開放,突破了企業應用知識的最後一公里。

我們可以發現,袁晶博士在華為雲推動的全新方向——知識計算,並不是一項單一產品或服務,而是一個關於全生命週期完成AI與行業知識融合的理念、方法,以及由此產生的一系列工具、能力。這些理念、能力、工具與具體行業、具體案例進行結合,獲得了各行業客戶、合作伙伴的深度共建,最終才凝結出全週期、可生長、具有行業特性的華為雲知識計算解決方案。

在知識計算築造和推廣的過程中,相關團隊非常重視其在不同行業、不同場景中的差異化表現與能力侷限。只有承認行業差異,才能尊重行業知識,逐個攻破行業應用AI的挑戰。

或許可以說,知識計算並不是一條捷徑,而是一個AI落地趨勢下的必經之路。這條路雖然並不好走,但總算是已經有了“開門人”。

衝鋒時:面向行業,AI突圍

或許,知識計算的價值聽起來會感覺有點過分抽象和模糊。這是因為整套解決方案涉及的技術領域眾多,總結起來較為理論化。確實,想要理解知識計算的價值,只有進入行業場景中這一個選擇。因為知識計算本就是為行業而生,也應該在行業中進行理解。

例如,在石油勘探的一個重要環節“測井”中,地球物理學家需通過對電阻率、自然電位、聲波等綜合資訊的研究進行油氣層識別。但要對數千米以下的地下構造和油藏特徵進行準確判斷還是非常困難的,這需要對大量資訊的綜合計算,還需要經驗豐富的專家準確分析才能做到。

以往時候,可能需要好幾個老專家幾個月時間完成的測井解釋工作,在知識計算幫助下可以在不到一星期內完成,而且油氣層識別準確率達到了專家的水平。這就是知識計算的必要性,它將專家的碎片化、經驗化知識轉化為可計算的模型,並將其遷移到更多工作的智慧化處理中。目前,中石油集團已經基於華為雲知識計算解決的打造了全球首個油氣領域人工智慧平臺,為我國油氣行業的創新發展提供了智慧化的驅動引擎和開發生態。

當然,在探索石油測井解釋的知識計算解決方案時,團隊也經歷了不少交流中的磨合期。比如在華為雲的AI專家給石油專家講解知識圖譜時,很自然地會舉一個在知識圖譜領域常用的例子:比如“劉德華”作為一個“實體”、他的妻子是“朱麗倩”、他們建立了“夫妻”的“關係”。但油氣領域的專家卻對明星的例子非常不解——他們面對的是地層、油井這些資料,娛樂圈的例子好像和油氣一點關係都沒有。但也正是在這種從不解到了解、相互磨合和溝通的過程中,知識計算逐漸真正與行業結合了起來。

在知識計算的發展歷程中,華為雲知識計算團隊真實意識到了各行業對相關能力的遠見和渴求。在一些必然磨合之上,是華為雲與行業客戶之間對於知識計算的高度認同與惺惺相惜。在疫情爆發之後,袁晶團隊與浙江大學計算機學院、浙江大學藥學院的師生建立了聯絡和合作。在第一次線上溝通中就一拍即合,決定圍繞病毒、基因、蛋白等已有知識庫和科研文獻構建新冠科研領域知識圖譜,用來幫助相關專家提升病毒家族資料分析、基因蛋白等分析的效率。在疫情疾風暴雨一般襲來時,華為雲的AI專家與高校專家第一時間投身到了智慧抗疫的前線。這可能是知識計算值得被記憶的另一面。

真正身在一線的企業,對知識計算的價值敏感性往往遠超於大眾想象。2020年,袁晶博士團隊的一位成員在HDC.Cloud大會期間做了一個企業知識圖譜的直播內容,同時釋出了一篇技術文章。這篇文章被一汽集團董事長看到,馬上指示資訊科技人員與團隊進行深入交流。通過線上、現場的多次溝通,最終孵化了一汽的知識計算智慧維修專案,為上千維修技師提供智慧化的維修助手,極大提升維修技師在定位問題和解決問題上的效率。通過使用一汽知識計算平臺,一汽紅旗某4S店的一次性修復率提升了4%,客戶維修等待時間下降了23%,廠家支援介入率下降了30%,維修技師的培養時間縮短了30%,為汽車維修帶來了全方位的價值提升。

各個行業、各個企業都可以基於華為雲知識計算解決方案,打造屬於自己的知識計算平臺,並將知識計算能力應用於研發、生產、運營、銷售、售後服務等企業核心流程。在煤炭行業,河南鑫磊集團採用華為雲知識計算解決方案後,煉焦業務實現了“降本提質”的雙重效果:生產效率方面,傳統方式原料煤質量檢測需要1天以上,現在配煤師只需要將配比輸入系統就會準確預測焦炭指標,預測準確率都在95%以上;經濟效益方面,以河南鑫磊集團每年130萬噸的產量來推算,每年至少可節省成本約3000萬。

在交通行業,交通管理部門可以運用知識計算解決方案,完成城市路口和區域的通行優化。目前,該方案已在深圳300多個路口進行了驗證,擁堵指數下降了8%。未來,知識計算將進一步運用到道路、機場、地鐵等立體化的交通治理。

在政務領域,知識計算解決方案能夠協助政府實現事件預警、處置措施推薦等功能。如此前在某城市12345熱線感知系統中,A通過熱線投訴小區鄰居噪音擾民問題,B在同一小區投訴小區垃圾比較多,這看似沒有關聯的兩個問題,用知識計算引擎去分析問題產生的根因,發現其實關鍵問題是這個區域有典型的群租現象,再通過智慧分撥關聯相關處理部門,利用機器人引擎推進流程和運轉,通過資料分析研判、人機協同處置的閉環全流程,將“問題解決在開口之前”,極大提升政務服務滿意度。

石油、汽車、醫療、化纖、煤焦化、鋼鐵、交通,政務…種種事關國計民生的重點行業,都可以看到知識計算的落地案例、發展趨勢與價值突圍。在AI與知識的深入融合中,行業可以真正面向AI時代發起衝鋒。

而這些可能性的開始,在於知識計算這扇大門的推開。這扇門,並不僅僅是一種技術創新或者產品打造,而是一種方向和銜接。它把廣泛存在的行業知識智慧化需求與AI執行力聯接到一起,不再讓行業面對智慧化時感覺茫然無措或者與我無關。

袁晶博士一直強調,知識計算是理念,是方法,是一系列像樂高積木一樣的工具。這些樂高確實需要企業使用者自己拼裝,但零件、規則和方法都已具備。企業可以用最大的效率、最簡單的方式完成適合自己的組裝,把知識變成智慧時代的生產力。

對於AI產業來說,知識計算是一扇全新的探索之門;但對於無數行業、無數企業來說,每個知識計算解決方案都是一扇獨一無二的門。推開它,也許就是新的時代。

據悉,今年11月11-12日在杭州舉辦的AIIA產業峰會中,中國人工智慧產業發展聯盟、華為、中國資訊通訊研究院三方將聯合釋出知識計算白皮書。屆時學界和產業界大咖將齊聚一堂,共話知識計算如何賦能新一代人工智慧與企業生產領域、流程環節深度融合,引領產業向價值鏈高階邁進,加速推進行業智慧化升級。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2838664/,如需轉載,請註明出處,否則將追究法律責任。

相關文章