在剛剛結束的國際 PHM 資料競賽中,崑崙資料的 K2 代表隊以絕對優勢一舉奪冠,成為 PHM Data Challenge 十年競賽史上首個完全由中國本土成員組成的冠軍團隊。團隊由崑崙資料首席資料科學家田春華博士帶領四名成員組成,在業餘時間完成了本次競賽的任務。
PHM(Prognostics & Health Management,即故障診斷與健康管理)學會從 2008 年成立一直專注於工業裝置故障診斷領域,其每年舉辦的「PHM 資料競賽」是國際上高水平的同類賽事之一。首屆競賽由國際 PHM 學會和 NASA 共同舉辦,此後賽事成為一項傳統,受到來自歐美工業界乃至軍工界的追捧,至今已經有 10 屆。往年的競賽題目包括「渦輪發動機的剩餘壽命預測」、「齒輪箱異常檢測」、「晶圓化學機械平坦化異常分類」等,今年則聚焦於「城軌車輛懸掛系統異常檢測」。
本次競賽包括兩個問題:
1)健康診斷:判斷城軌車輛懸掛系統是否處於故障狀態
2)故障定位:從故障車輛的 22 個部件中識別出 1~2 個故障部件
這個題目具有重要的現實意義,可以延伸至高鐵、地鐵以及汽車等應用領域。
圖為懸掛系統模型,分為一級減震和二級減震,由 22 個部件組成(彈簧/阻尼),共安裝 18 個振動感測器(紅色標識)
本次競賽分兩個階段,階段一為模型的訓練與測試,訓練集為 200 個健康車輛軌道執行資料,測試集為 200 個待判軌道車輛執行資料;階段二是模型的驗證,驗證集為 200 個待判軌道車輛執行資料。
「這裡的難點在於,訓練資料集中都是健康樣本,沒有異常。」田春華說,「可是往往有價值的則是異常資料,這是工業場景中普遍存在的現象。」實際工業場景中的異常資料較少,而且工業系統進行過多次調優,所以絕大部分工業資料均為正常資料,這與研究人員進行大資料分析的過程中希望具備全模態樣本的期望相背。「比如近萬颱風機中,三年內可能只有個位數的風機出現過重大故障。想想樣本得有多麼不均衡吧。」他補充道。
解決這個問題有兩種思路,一是用資料模型精確刻畫所有的正常情形,只要脫離正常情形就判定為異常,這需要進行細緻入微的建模,但會存在誤判的情況;二是讓模型具備通用性,考慮軌道、速度、負載等外生變數對系統產生的影響,同時考慮系統執行是一個動態的過程,要尋找到不變數。
K2 團隊在 PHM 競賽中的解題思路
「好在我們拿到了 18 個感測器的資料,系統內部的相關性非常強,所以可通過訊號上下前後的一致性來增加一些判斷。」田春華表示,團隊為此加工了減振比等特徵。「我們過去在這個問題上積累了很多經驗,所以一開始就抓住了問題的基本面。在選擇了正確的特徵加工路徑之後,精度可以達到 80% 以上,接下來再進行演算法的調整和優化。」此外,團隊還使用了基於相似度的軌道位置匹配減弱軌道不平整的影響。
在判斷出系統處於正常還是異常狀態後,團隊面臨著第二個考驗,即指出到底是哪些彈簧或阻尼發生了故障。據田春華介紹,由於訓練集全部為正常樣本,所以這裡需要結合自動控制理論中頻域分析的知識:彈簧可以控制振幅,阻尼會使振幅衰減。在這個機理的基礎上,資料驅動才能實現。
「其實當初在第二個問題上,我們也只是有一個大概的想法,沒有必勝的把握。後來使用了多模型才有了一點突破,這都是我們意料之外的。而且跟往年的題目相比,今年的題目機理較強。雖然過去我們有很多經驗,但是為了進行佐證,團隊仍然查閱了大量的文獻。」田春華回憶道。
K2 團隊在 PHM 競賽中的調優曲線圖
事實上,競賽的兩個問題原本的分值比重各佔 50%。各領先團隊在第一個問題上的分數相差不多,但由於第二個問題難度較大,K2 團隊佔據了絕對領先優勢。組委會出於競賽趣味性的考量,更改了規則,把兩個問題的分值比重改為 3:1。
「我們還是處於領先,只是優勢沒有那麼大了。」田春華說道。最終,K2 團隊的模型在第一個問題上的準確率達到 82.5%,在第二個問題上的靈敏度達到 53.5%,以 0.762 的總成績摘得桂冠。
在談到團隊奪冠經驗時,田春華表示,在短時間內把資料和機理有效結合,這對選手的專業性要求極高。K2 團隊成員來自不同的領域,如自動化、統計、計算機,實現了優勢互補。特徵加工為後續研究奠定了基礎,機理確定則幫助團隊瞄準了方向。
在工業領域,企業希望最大程度地挖掘工業大資料的潛在價值並將其高效延伸至實際的細分場景,進而實現對工業業務理解的加深、降低實際決策所帶來的不確定性。換言之,這些企業需要一個「醫生」,這位「醫生」需要通過「望聞問切」掌握工業機器的健康狀況,不僅要能診斷出機器是否「生病」以及「病因」,並且對症下藥,還要具備預測機器什麼時候將會「生病」的能力。
舉例來說,風機葉片受到低溫環境因素的影響,可能會面臨結冰的問題,這不僅存在安全隱患,也會對風機的效率與健康帶來不良的後果。由於許多風機部署於較為偏遠的地區,單純依靠人力難以實現對風機狀況的監測。如果可以使用感測器採集風機的資料指標,然後傳輸回機控中心加以分析,那麼企業員工就能夠遠端掌控每一個風機的狀態資訊。因此,一個能夠適應複雜地形、複雜氣象條件的資料分析模型就十分必要了。
在人工智慧技術興起之後,工業大資料領域的研究人員就開始嘗試使用新技術處理問題,並將其應用於一些資料量較大的工業應用案例。田春華介紹,公司在風機結冰問題上就曾使用過深度學習技術進行自動識別,而且表現不錯。「在做風機結冰專案的時候,利用深度學習上來就取得 70% 的精度,這樣我們對模型精度有了一個基準。然後我們加工特徵後,通過白箱模型讓精度提升至 80% 以上。」他解釋道,「在處理實際工業問題時,我們通常先用深度學習快速得到一個基準,然後再做一個白箱模型,因為工業界的一線操作人員還是希望模型具有可解釋性。某種程度上,人工智慧技術降低了加工特徵的工作量和資料分析的門檻。」
「當前人工智慧存在一定的封閉性,雖然具有巨大的發展空間。在工業大資料領域,基於統計的資料分析方法並不是唯一的技術手段。」崑崙資料 CTO 王晨解釋道,「我們認為,工業領域人工智慧突破的方向在於,如何把統計模型與領域內的知識與機理模型深度融合。這也是我們研究的一個重要方向。」
「具體到工業領域中的實際問題,遠比競賽複雜和有趣得多,從大資料分析應用領域來說,除了 PHM 之外,大資料還可以在生產效率提升、產業網際網路等方面發揮相當大的價值。」
在 SMT(印刷電路板)產線,SPI 機臺利用光學檢測自動研判錫膏塗抹質量,但往往過於嚴格,導致很多符合工程設計要求的產品被判定不合格。對於高價值產品,SPI 研判為不合格的板子還需要大量的人工復判。使用機器學習方法自動識別,部分篩選出合格品,這將大大降低人的工作量。
但在石油管道洩漏檢測中,機器學習的重點就是降低虛假預警。利用負壓波檢測是否存在洩漏相對容易,但造成壓力下降的因素較多,除了洩漏,還有不同油品輸送壓力不同、油罐更換等正常工況變化的影響。幸運的是,我們發現不同原因造成的壓力下降曲線形狀存在細微差別,有的曾現底部震盪,有的曲線光滑但間雜毛刺。利用模式識別技術可自動匹配出識別出的壓力下降的真正故障原因,降低了虛假預警給實際運維帶來的困擾。
工業大資料的三大典型方向
「一個完整的工業大資料分析要整個流程打通,從開始的接入管理、規劃、資料整合、深度分析,到後來的應用、業務流程,以及誰是工業產品的目標使用者、選擇工業產品的原因及利好等等,這些問題都是工業大資料平臺要給出的答案。」田春華說道。
崑崙資料專注於做工業企業的大資料合夥人,成立於 2014 年底,創始團隊來自 IBM、華為、西門子等科技企業,公司於 2015 年 1 月完成天使輪融資,同年 9 月獲得來自達晨創投的數千萬人民幣 A 輪融資,2016 年 8 月完成 1 億人民幣 B 輪融資,如今團隊有 100 餘人。目前,崑崙資料已推出工業大資料平臺產品 KMX,著眼於管理分析海量機器資料,挖掘展現資料價值,幫助企業為資料賦能、實現業務洞察、形成行動閉環。
以風機的運維場景為例,KMX 平臺可以把風機附近的氣象資訊、地理資訊、包含歷史養護資訊的裝置日誌等關聯起來,為接下來的資料分析提供有力支援。在沒有大資料平臺的情況下,這些資料是散落在各個系統中的,無法為資料分析提供上下文資訊,可能導致資料探勘和分析結果較為片面。
目前,崑崙資料主要聚焦於能源行業、裝備製造以及電子製造這三個領域。王晨介紹,為了保障企業的資料安全,崑崙資料會施行事前及事後的許可權管理策略,設定了嚴格的訪問許可權及痕跡追蹤管理。王晨表示:「工業大資料領域正處於方興未艾階段,市場空間較大,我們也正在積極探索的過程中。」
今年,崑崙資料參與舉辦了首屆中國工業大資料創新競賽,該賽事由工信部指導、信通院主辦,吸引了來自海內外 1000 多支參賽團隊。崑崙資料受邀承擔出題任務並擔任決賽評審專家。此次競賽的兩道競賽題目分別為「風機葉片結冰檢測」和「風機齒形帶斷裂預警」。談及投入不少精力來推動中國自己的工業大資料競賽,「也是希望大家能多關注這個領域,這裡面的確有許多有意思的問題。」田春華笑道。
至於未來,人工智慧是否能在工業大資料領域有所突破?遷移學習是否能在強機理的現實世界中找到落點?工業大資料還隱藏著哪些未被挖掘出的潛力?
想必隨著時間的推移,這些專攻工業大資料的科學家們一定會在實踐中找到令人驚喜的答案。