大資料下數模聯動的隨機退化裝置剩餘壽命預測技術(部分)
摘要
面向大資料背景下隨機退化裝置剩餘壽命(Remaining useful life, RUL)預測的現實需求, 結合隨機退化裝置監測大資料特點及剩餘壽命預測不確定性量化這一核心問題, 深入分析了機理模型與資料混合驅動的剩餘壽命預測技術、基於機器學習的剩餘壽命預測技術、統計資料驅動的剩餘壽命預測技術以及機器學習和統計資料驅動相結合的剩餘壽命預測技術的基本研究思想和發展動態, 剖析了當前研究存在的侷限性和共性難題. 針對存在的侷限性和共性難題, 以多源感測監測大資料下剩餘壽命預測問題為例, 提出了一種數模聯動的大資料下隨機退化裝置剩餘壽命預測解決思路, 並透過航空發動機多源監測資料初步驗證了該思路的可行性和有效性. 最後, 借鑑數模聯動思路, 綜合考慮機器學習方法和統計資料驅動方法的優勢, 緊緊扭住大資料背景下隨機退化裝置剩餘壽命預測不確定性量化問題, 提出了大資料背景下深度學習與隨機退化建模互動聯動、監測大資料與剩餘壽命及其預測不確定性對映機制、非理想大資料下的剩餘壽命預測等亟待解決的關鍵科學問題.
關鍵詞
大資料 / 剩餘壽命預測 / 數模聯動 / 深度學習 / 隨機退化建模
高速列車、航空航天裝備、武器、風電裝備、工業機器人、石化裝備等現代裝備在功能不斷提升的同時, 正逐漸趨於大型化、多元化和整合化, 這類裝備多是由機械傳動系統、電磁驅動系統、運動控制系統、資訊感測系統等耦合組成的複雜系統, 其服役過程受變環境、變載荷、變工況、大擾動和強衝擊等因素影響, 整體及關鍵部件效能將發生不可避免的退化, 一旦因裝置效能退化造成最終失效, 將會造成巨大的人員傷亡和財產損失. 例如, 2014年8月2日發生在我國江蘇省崑山市的重大鋁粉塵爆炸事故, 共造成97人死亡、163人受傷, 直接經濟損失達到3.51億元, 事後調查表明: 除塵器維護不足而造成集塵桶鏽蝕退化破損是主要技術原因. 2017年7月發生在美國密西西比州的美國海軍陸戰隊KC-130運輸機墜毀事件, 造成機上16名軍人全部遇難, 該事故的調查結果表明發動機螺旋槳效能退化是造成飛機墜毀的主要原因. 因此, 若能在裝置效能退化初期, 尤其在尚未造成重大危害時, 根據狀態監測資訊, 及時發現異常或定量評價裝置健康狀態並預測其剩餘壽命(Remaining useful life, RUL), 據此對裝置實施健康管理, 對於切實保障複雜裝置的執行安全性、可靠性與經濟性具有重要意義. 其中, 剩餘壽命預測是連線系統執行狀態資訊感知與基於執行狀態實現個性化精準健康管理的紐帶和關鍵, 在過去十餘年得到了長足的發展, 主要技術方法包括失效機理分析方法、資料驅動的方法、機理模型和資料混合驅動方法, 如圖1所示. 基於失效機理分析的方法主要透過構建描述裝置失效機理的數學模型, 結合特定裝置的經驗知識和缺陷增長方程實現裝置的剩餘壽命預測. 由於實際工程裝置本身的複雜性、任務與執行環境的多樣性,其健康狀態演化規律通常難以物理機理建模或者獲得失效機理模型的代價過高, 導致失效機理方法及機理模型和資料混合驅動方法存在推廣應用難的問題. 因此, 資料驅動的剩餘壽命預測技術已成為國際上可靠性工程和自動化技術領域的研究前沿, 過去十餘年中得到了長足發展, 在航空航天、軍事、工業製造等領域具有極其重要的應用.
圖 1 剩餘壽命預測方法體系
伴隨著先進感測技術的快速發展, 工程裝置健康狀態感知手段日益豐富, 為裝置執行監測大資料的獲取提供了更多的可能. 因此, 資料驅動的剩餘壽命預測技術發展迎來了新的契機, 針對大資料處理的隨機退化裝置剩餘壽命預測問題得到了大量學者的關注, 相關技術蓬勃發展. 在此背景下, 本文的主要目的在於面向大資料背景下隨機退化裝置剩餘壽命預測的現實需求, 透過分析當前剩餘壽命預測技術的發展動態, 旨在探究該領域亟待解決的關鍵問題和新的發展方向. 為此, 第1節首先結合資料特點對大資料下剩餘壽命預測的研究背景、主要方法及思路、核心問題等進行了概述. 第2 ~ 5節分別分析了機理模型與資料混合驅動的剩餘壽命預測技術、基於機器學習的剩餘壽命預測技術、統計資料驅動的剩餘壽命預測技術以及機器學習和統計資料驅動相結合的剩餘壽命預測技術的基本研究思想和發展動態, 同時結合隨機退化裝置監測大資料特點以及剩餘壽命預測不確定性量化這一核心問題, 深入剖析了當前研究存在的侷限性和共性難題. 第6節針對當前研究存在的侷限性, 提出了一種多源感測監測大資料下數模聯動的隨機退化裝置剩餘壽命預測問題解決思路(簡稱為數模聯動, 這裡需要說明的是, “數”是指資料退化特徵提取, “模”是指所提取退化特徵時變演化過程隨機建模), 透過構建最佳化目標函式實現資料特徵提取與所提取特徵時變演化過程隨機建模的“聯動”, 並透過航空發動機多源監測資料初步驗證了該思路的可行性和有效性. 第7節借鑑數模聯動思路, 圍繞大資料背景下隨機退化裝置剩餘壽命預測不確定性量化這一核心問題, 探討並提出了大資料背景下深度學習與隨機退化建模互動聯動、監測大資料與剩餘壽命及其預測不確定性對映機制、非理想大資料下的剩餘壽命預測等亟待解決的關鍵科學問題. 第8節總結全文.
1. 大資料下剩餘壽命預測問題概述
近年來, 隨著無線感測、物聯網等技術快速興起與普及, 各式感測器猶如一張龐大的神經網路密佈在裝備內部, 實時感知裝備的一舉一動, 推動剩餘壽命預測進入“大資料” 時代. 例如, 軍事裝備在國家戰略安全中具有不可替代的特殊地位, 其各子系統的安全可靠執行舉足輕重, 必須依靠狀態監測、剩餘壽命預測以及預測維護等理論與方法保駕護航. 由於需要監測的軍事裝備群規模大、每個裝備需監測參量多、資料取樣頻率高、服役時間長, 所以獲取了海量監測資料: 一個現代航空發動機, 每10毫秒就能生成幾百個感測器資訊, 每次飛行能產生TB級的執行監測資料; 現代化工業製造生產線安裝有數以萬計的各型感測器來監測工業裝備的執行過程資訊及產品質量資訊, 比如大型工業機器人制造商利用雲平臺監控著百萬臺工業機器人, 實時獲取機器人每個運動關節的轉速、角度、位置、溫度、振動等訊號, 每天需要對TB級以上的資料進行處理. 然而, 這些監測大資料在為裝置健康狀態感知及剩餘壽命預測提供豐富資訊的同時, 由於裝置工況多變、多源訊號差異大、取樣策略形式多、資訊之間相互耦合、資料價值密度低, 導致資料質量參差不齊, 狀態監測大資料呈現不同的統計特性. 根據監測資料呈現的特點, 圖2給出了完整監測大資料和非完整監測大資料(具有碎片化、分段的、稀疏性等特徵)的示例.
圖 2 完整的、碎片化的、稀疏的監測大資料示例
這裡完整監測大資料主要針對執行模式比較固定的隨機退化裝置(如軸承、齒輪等), 能夠實現不間斷連續監測, 監測大資料涵蓋了裝置從開始執行到失效比較完整的狀態資料, 而非完整監測大資料主要針對受經濟條件及現實監測條件限制的隨機退化裝置(如航空發動機、渦輪泵、配電電池等), 對這類裝置進行連續監測取樣是不現實的, 只能間歇性地對其監測, 得到的狀態監測大資料表現出一定的“碎片化、分段、稀疏”等特點. 因此, 當剩餘壽命預測進入大資料時代, 如何根據監測大資料呈現出的不同特點, 充分分析利用豐富的監測大資料資源, 從浩如煙海的資料中進行“沙裡淘金”, 深度挖掘出反映裝置健康狀態的資訊並據此進行剩餘壽命預測, 是隨機退化裝置剩餘壽命預測領域亟需解決的關鍵問題.
資料驅動的剩餘壽命預測方法基於裝置執行監測資料, 透過擬合裝置效能變數演化規律並外推到失效閾值, 或建立監測資料與失效時間的對映關係, 以實現剩餘壽命預測, 為大資料背景下隨機退化裝置剩餘壽命預測提供了可行的技術思路. 然而, 剩餘壽命指當前時刻到系統失效時刻的有效時間間隔, 因此剩餘壽命預測實際上是根據當前得到的監測資訊, 對系統將來失效事件的預測, 其預測結果不可避免的具有不確定性. van Asselt等從哲學和認識論的角度討論了預測的不確定性處理問題, 指出預測結果具有不確定性是學術界的共識, 也是當今時代的特徵. 聯合攻擊機F-35專案組研究人員Hess等和Smith等、壽命預測領域代表性學者馬里蘭大學先進生命週期工程中心Pecht教授等、可靠性領域知名期刊Quality and Reliability Engineering International主編Brombacher教授透過各種事例強調了預測不確定性的量化是剩餘壽命預測從理論到應用轉化的核心. 美國國家航空航天局(National Aeronautics and Space Administration, NASA)預測與健康管理中心研究規劃中也將剩餘壽命預測不確定性的管理列為了中心發展路線圖的重要研究內容. 由此可見, 預測不確定性的量化是資料驅動隨機退化裝置剩餘壽命預測領域的一個核心問題, 也是解決“敢用、能用” 剩餘壽命預測理論技術實現實際工程裝置個性化精準健康管理、保障裝置長週期安全可靠執行的關鍵所在.
隨著資訊科技和感測器技術的迅猛發展, 資料驅動的剩餘壽命預測技術由於適用範圍廣、容易實現、無需深入專業機理知識等優點, 作為其中典型代表的機器學習方法和統計資料驅動方法已獲得了大量研究和蓬勃發展, 得到了學術界和工業界的廣泛關注, 相關技術已經在 武器、航空航天、風力發電、工業製造等領域產生了重要應用[14-16]. 儘管以機器學習方法和統計資料驅動方法為典型代表的資料驅動隨機退化裝置剩餘壽命預測已獲得了大量研究和蓬勃發展, 但已有理論與方法在大資料背景下隨機退化裝置剩餘壽命預測及其預測不確定性量化這一核心問題上, 仍然沒有系統有效的解決方法, 主要體現在統計資料驅動方法處理大資料能力不足, 而機器學習方法量化預測不確定效能力不足. 因此, 透過對大資料背景下剩餘壽命預測研究發展脈絡的探究, 深入剖析當前研究存在的瓶頸問題, 對於促進隨機退化裝置剩餘壽命預測技術的發展具有重要意義. 在第2 ~ 5節, 將針對當前大資料背景下剩餘壽命預測典型解決思路的研究動態和存在的問題進行具體的分析.
2. 機理模型與資料混合驅動的剩餘壽命預測
基於機理模型的方法主要是依據失效機理構建描述裝置退化過程的引數化數學模型, 結合裝置的設計試驗資料或經驗知識辨識數學模型引數, 進而基於狀態監測資料更新機理模型引數實現裝置的剩餘壽命預測. 典型的引數識別與更新方法包括: 卡爾曼濾波[17-19]、粒子濾波[20-21]和貝葉斯方法[22-23]等. 常見的用於剩餘壽命預測的機理模型包括: Paris模型、Forman模型以及在其基礎上的各種改進和擴充套件模型, 主要用以描述裂紋擴充套件和層裂增長[24-25]. 例如, Li等[26-27]基於Paris模型, 建立了缺陷增長率與缺陷面積及材料常數的對映關係, 以預測滾動軸承的剩餘壽命; Li等[28]提出了Paris裂紋擴充套件模型, 根據裂紋尺寸和動態載荷預測齒輪的剩餘使用壽命; Liang等[29]研究了基於Paris模型的滾珠軸承剩餘使用壽命自適應預測方法, 即使在缺乏先驗資訊且缺陷增長為時變的情況下, 也能獲得可靠的預測結果. Oppenheimer等[30]利用線彈性斷裂力學, 對轉軸建立了基於Forman裂紋擴充套件的壽命模型; 針對層裂增長故障, Marble等[31]開發了一種渦輪發動機軸承的層裂增長預測模型, 能夠根據工況估計層裂增長軌跡和故障時間, 並利用診斷反饋進行自調整, 降低了預測不確定性; Choi等[32]考慮了由於裂紋形成和磨粒磨損引起的層裂增長現象, 提出了滾動接觸的層裂增長壽命模型. 在充分理解失效機理並得到準確的模型估計引數後, 基於機理模型的方法能夠實現對剩餘使用壽命的精確預測. 然而, 以上現有基於機理模型的剩餘壽命預測方法未能結合實際執行裝置的實時監測資料, 難以準確反映裝置當前執行的實際狀態, 特別是在裝置執行環境、執行工況發生變化時, 若不能利用實時監測資料對模型進行更新, 將產生較大的預測偏差.
為了使得機理模型能夠更好地建模實際服役個體裝置的效能演變過程, 將裝置實時執行監測資料與機理模型進行混合, 將有助於實現剩餘壽命預測準確性的提升. 因此, 機理模型與資料混合驅動的剩餘壽命預測方法也得到了較多的關注和發展[4]. 最近該方面的研究包括Liao等[33]、Wang等[34]的論文, 這些研究分別針對鋰電池系統和旋轉機械裝置, 提出了機理模型與資料混合驅動的剩餘壽命預測方法. 根據機理模型與資料混合驅動實現方式不同, 可將這類混合驅動的剩餘壽命預測方法分為兩大類: 1)基於監測資料構建機理模型所刻畫退化狀態的測量模型, 運用卡爾曼濾波、粒子濾波等方法估計退化狀態和機理模型引數, 然後透過機理模型預測裝置的剩餘壽命[12, 35]; 2)首先分別基於資料和機理模型進行裝置的剩餘壽命預測, 然後利用決策層融合方法實現整合基於資料和基於機理模型的剩餘壽命預測[36-37]. 以上兩類機理模型與資料混合驅動實現剩餘壽命預測的方式各具優勢: 第1種方式能夠充分考慮退化狀態難以直接測量的實際, 在考慮監測資料中測量噪聲的情況下, 可實現隱含退化狀態的估計和機理模型引數的更新, 使得最終的預測結果能夠更準確地反映裝置當前的實際狀態; 第2種方式實現過程相對簡單獨立, 決策層融合的形式較為多樣, 如平均法、權重平均、核迴歸、證據組合等, 能夠整合多種方法的優勢, 有助於提升預測結果的魯棒性.
雖然基於機理模型的方法和機理模型與資料混合驅動方法得到了一定的發展, 但其成功應用的基礎是可獲取精確可靠的機理模型. 隨著當代裝置逐步呈現複雜化、非線性化以及高維化等特徵, 其健康狀態演化規律通常難以精確機理建模或者獲得失效機理模型的成本過高. 現有研究中透過物理機理分析、理化分析、實驗分析等手段獲取的機理模型主要針對特定材料或物件, 這一點也可以透過當前機理模型的種類相當匱乏反映出, 由此在一定程度上限制了這類方法的廣泛應用. 因此, 在大資料背景下, 透過挖掘資料中隱含的裝置健康狀態資訊, 發展資料驅動的剩餘壽命預測方法成為當前的主流和研究的焦點.
3. 基於機器學習的剩餘壽命預測
基於機器學習的裝置剩餘壽命預測主要思路是透過機器學習擬合效能變數演化規律並透過滾動外推到失效閾值以預測失效時間, 或直接建立監測資料與失效時間的對映關係實現端到端的預測, 基於此透過預測的失效時間減去當前執行時間得到剩餘壽命的預測值. 裴洪等[38]和Khan等[39]分別綜述了機器學習方法和深度學習方法在剩餘壽命預測與健康管理領域的研究應用現狀. 為區別於以上綜述中介紹的工作, 本文重點結合最新的研究進展和大資料下剩餘壽命預測的現實需求, 對基於機器學習的剩餘壽命預測技術發展動態和存在的問題進行分析. 根據機器學習網路模型結構特點, 這類方法主要分為基於淺層機器學習的方法和基於深度學習的方法.
3.1
基於淺層機器學習的剩餘壽命預測
基於淺層機器學習的剩餘壽命預測方法中的典型代表為神經網路、支援向量機等, 具體發展動態分述如下.
1) 神經網路
神經網路是一種模擬人類中樞神經系統組織結構與資訊處理機制的學習網路, 主要由輸入層、隱層和輸出層組成[40]. 神經網路具有自學習、自組織、自適應以及強非線性對映擬合能力等優點[41-42], 因而在裝置剩餘壽命預測領域受到了學者們的廣泛關注[43-45]. 早在2004年, Gebraeel等[46]就將單隱層前饋神經網路用於機械裝置振動訊號建模, 透過外推至失效閾值實現剩餘壽命預測. Mahamad等[47]透過改進前饋神經網路訓練演算法, 將改進後的網路用於旋轉機械的壽命預測. Lim等[48]採用特徵時序直方圖法從多源監測資料中提取了具有區域性趨勢性的退化指標, 然後將這些退化指標輸入到多層感知機中去預測航空發動機的剩餘壽命. Drouillet等[49]將單隱層前饋神經網路用於高速銑刀剩餘壽命預測. Ahmadzadeh[50]等使用多層感知機去預測研磨機剩餘壽命. Zhang等[51] 基於小波包分解、快速傅立葉變換和反向傳播神經網路構建了鼓風機剩餘壽命預測模型. 徐東輝[52]提出了多類神經網路組合預測的方法, 利用改進的Elman神經網路和非線性自迴歸神經網路兩個單項預測模型進行預測, 並且藉助於徑向基函式神經網路對兩個單項模型的預測值進行非線性組合, 實現了剩餘壽命預測. 楊洋[53]研究了一種基於自迴歸移動平均和後向傳播神經網路組合模型的鋰電池壽命預測方法, 有效結合了兩者在短期預測方面與非線性擬合方面的優勢. 在最新的研究中, Bektas等[54]透過引入感測器選擇、資料歸一化、特徵提取等資料預處理技術, 將預處理後的資料用於訓練神經網路, 提出了一種基於神經網路和相似性的剩餘壽命預測方法. Li等[55]利用監測資料訓練了多個神經網路, 基於加權平均思想提出了一種基於整合網路的剩餘壽命預測方法.
2)支援向量機
支援向量機是由Cortes[56]和Vapnik[57]於1995年首次提出的, 在小樣本和高維資料機器學習領域受到廣泛關注, 主要原理是首先透過非線性變換將多維輸入向量對映到高維特徵空間, 然後在高維特徵空間中構造最優超平面來實現樣本分類或迴歸. 由於支援向量機能夠有效避免“維數災難”問題, 且具有較好的泛化能力, 因而廣泛應用於裝置的剩餘壽命預測中[58-61]. 例如, Soualhi等[62]利用Hilbert-Huang變換構建了滾動軸承的敏感退化指標, 然後將這些退化指標輸入到支援向量機中實現了旋轉軸承的剩餘壽命預測; Sun等[63]構建了貝葉斯最小二乘法支援向量機預測模型, 並將其用於微波器件的剩餘壽命預測; Nieto等[64]將支援向量機應用到了航空發動機的剩餘壽命預測中; Khelif等[65]研究提出了一種不需要建立健康指標、故障狀態等直接基於支援向量迴歸模型建立監測資料與裝置壽命的擬合關係, 進而實現了剩餘壽命預測. Huang等[66]對基於支援向量機的剩餘壽命預測方法研究現狀、應用領域及發展趨勢進行了系統地梳理和分析.
3)其他淺層模型
除了以上幾種常用的淺層模型外, 一些其他機器學習模型也被應用到裝備的剩餘壽命預測中, 如極限學習機[67]、貝葉斯網路[68]、隨機森林[69]、梯度提升決策樹[70]、基於案例的學習方法[71]、基於案例的推理方法[72]等. 文獻[38]對基於淺層機器學習的剩餘壽命預測方法進行了詳細綜述, 本文不再贅述.
透過文獻總結分析可以發現, 雖然淺層神經網路訓練相對比較容易, 基於淺層機器學習方法實現裝置剩餘壽命預測的研究具有較長的歷史, 但這類方法中採用的網路結構簡單、預測效能較多地依賴於專家先驗知識與訊號處理技術, 且難於量化剩餘壽命預測結果的不確定性. 此外, 這類研究中較多的方法需藉助人工經驗與知識預先提取監測資料中的關鍵資訊並構建退化指標, 因此退化指標的好壞將很大程度上決定淺層神經網路的預測效能. 在大資料時代, 裝置退化特徵愈發表現出耦合性、不確定性、非完整性等特點, 淺層機器學習演算法自學習能力較弱, 難以自動處理和分析海量監測資料. 因此, 大資料下剩餘壽命預測的智慧學習模型由“淺”入“深”、勢在必行.
3.2
基於深度學習的剩餘壽命預測
深度學習作為一種大資料處理工具, 旨在模擬大腦學習過程, 構建深度模型, 透過海量資料學習特徵, 刻畫資料豐富的內在資訊, 最終提升建模精度. 深度學習自從2006年在Science上首次提出便掀起了學術界和工業界的研究浪潮, 如雨後春筍, 以其強大的海量資料處理能力在諸多領域的大資料分析中方興未艾. 經過了十餘年的探索, 深度學習當前已成功應用於許多工程領域, 如影像識別[73]、自然語言處理[74]、語音識別[75]、故障診斷[76]等, 同時在剩餘壽命預測領域也嶄露頭角. 如圖1所示, 根據網路結構的不同, 這類方法主要包括: 基於深度自編碼器的方法、基於深度置信網路的方法、基於卷積神經網路的方法、基於迴圈神經網路的方法以及多種網路組合而成的混合網路方法. 無論基於哪種深度網路結構形式, 其基本思想都是採用現有深度學習模型建立效能測試資料與剩餘壽命標籤或退化標籤之間的潛在關係. 下面針對幾種典型的深度學習網路, 介紹其應用於剩餘壽命預測時的研究動態並分析當前研究存在的問題.
1)深度自編碼網路
深度自編碼網路是由多個自編碼器或降噪自編碼器堆疊組成的深度神經網路. 基於深度自編碼網路的剩餘壽命預測透過提取出原始資料的深層次特徵, 然後透過邏輯迴歸層或全連線層實現機械裝備的剩餘壽命預測[77-80]. 由於自編碼器是以重構原始輸入為學習目標, 因而其學習到的特徵對資料有更本質的刻畫, 有利於提高預測精度, 且深度自編碼網路能夠以無監督學習方式逐層對網路引數進行預訓練, 將訓練結果作為反向微調的初始值, 確保了網路引數的線上更新, 在剩餘壽命預測領域得到了廣泛的應用[81-85]. 例如, Xia等[79]提出了一種基於深度自編碼網路的兩階段剩餘壽命預測方法, 首先運用深度降噪自編碼器網路對監測大資料進行階段劃分, 然後訓練深度自編碼網路得到每個階段的退化特徵, 最後透過迴歸方法分析各階段特徵實現剩餘壽命預測. 然而, 深度自編碼網路在處理力訊號、振動訊號、聲發射訊號、光訊號等高維原始監測資料時, 其仍需要藉助各類訊號處理技術來提取裝置的退化指標.
2)深度置信網路
深度置信網路主要是由多個受限波爾茲曼機堆疊與一個分類層或迴歸層組合形成的深度網路, 透過逐層預訓練和反向精調策略解決深度模型普遍存在的訓練困難問題, 不僅能實現資料從淺層到深層的特徵表示與提取, 而且能發現輸入資料的分散式特徵, 在深層特徵提取方面獲得了廣泛的應用. 例如, Jiao等[86]提出了一種基於深度置信網路的健康指標構建方法用於裝備的剩餘壽命預測, 該方法採用無監督學習的策略融合多個感測器監測資料對裝備健康狀態進行評估, 得到描述其退化程度的健康指標用於剩餘壽命預測. 需要注意的是, 深度置信網路在實際中的應用主要集中在深層次特徵提取方面, 單純利用深度置信網路實現剩餘壽命預測的研究還相當有限, 需要與其他網路混合進行才能進行剩餘壽命預測.
3)卷積神經網路
卷積神經網路作為一類經典的前饋神經網路, 是由LeCun等[87]首次提出並用於解決影像處理問題的, 主要由若干卷積層和池化層組成, 既能輸入序列資料, 也能處理網格化資料, 在計算機視覺、語音識別等領域應用十分廣泛. 針對裝置效能監測大資料的特點, 先後發展出了多種用於剩餘壽命預測的卷積神經網路, 主要包括深度卷積神經網路[88]、多層可分離卷積神經網路[89]、多尺度卷積神經網路[90]、聯合損失卷積神經網路[91]等. Babu等[92]首次將深度卷積神經網路應用於剩餘壽命預測領域, 採用兩個卷積層和兩個池化層提取原始訊號特徵, 同時結合多層感知器實現剩餘壽命的預測. 最近, Yang等[93]提出了一種基於兩個卷積神經網路的剩餘壽命預測方法, 其中一個是分類網路用於監測效能退化的初始時刻, 另一個是迴歸網路用於預測剩餘壽命. 相比於其他深度學習網路, 卷積神經網路能夠更有效地處理力訊號、振動訊號、聲發射訊號、光訊號等高維原始資料, 可實現從監測資料中自動提取退化特徵資訊, 適合處理監測大資料且具有降噪的功能, 同時其網路引數量相對較少, 訓練更加方便高效, 因此易於構建更深的網路結構. 然而, 隨機退化裝置的監測資料蘊含的健康特徵往往是時序相關的, 而卷積神經網路在應對大資料下時序特徵提取能力不足, 容易造成重要時序特徵的丟失, 這對於剩餘壽命預測是不利的, 因此卷積神經網路在應用於剩餘壽命預測時經常與其他深度網路組合使用.
4)迴圈神經網路
迴圈神經網路作為一類包含前饋連線與內部反饋連線的前饋神經網路, 主要用於處理具有相互依賴特性的監測向量序列, 由於其特殊的網路結構, 能夠保留隱含層上一時刻的狀態資訊, 目前已經在剩餘壽命預測領域得到廣泛的關注, 被應用於鋰電池系統[94]、風力發電裝置[95]、航空發動機[96]等. 為解決迴圈神經網路通常存在“記憶衰退”進而導致預測偏差較大這一問題, 學者們對迴圈神經網路模型進行了改進, 提出了一種長短期記憶(Long short term memory, LSTM)模型, 門結構作為LSTM的獨特結構, 能夠在最優條件下確定出所透過資訊特徵, 在剩餘壽命預測領域獲得了廣泛的應用[97-98]. 例如: 為解決執行和環境擾動引起的不確定性問題, Elsheikh等[99]對LSTM的結構分別進行了改進, 提出了基於雙向LSTM的剩餘壽命預測方法. 雖然迴圈神經網路在隨機退化裝置退化過程建模方面具有先天優勢, 但當處理長期依賴型退化資料時, 迴圈神經網路在訓練過程中也經常面臨梯度消失或爆炸問題. 同時, 以上基於迴圈神經網路的剩餘壽命預測研究中都未考慮預測結果不確定性的量化問題, 只能輸出一個剩餘壽命的點估計, 難以評估預測結果的置信度.
最近, 針對剩餘壽命預測不確定性量化問題, Zhang等[100]在假定退化資料服從正態分佈的前提下利用Monte Carlo方法從退化資料中隨機取樣, 透過改變LSTM網路輸入, 在不同網路輸入下得到不同的剩餘壽命預測值, 由此構造剩餘壽命的數值分佈, 試圖量化預測不確定性. Huang等[101]利用雙向LSTM網路預測剩餘壽命輸出的均方根誤差構建剩餘壽命預測的誤差帶, 以區間的形式表示預測不確定性. Yu等[102]對退化監測資料進行劃分、以退化量為標籤, 建立了多個基於LSTM網路的退化量預測模型, 然後透過滾動預測的思想將預測值作為模型輸入迭代預測至退化量超過失效預測的時刻, 由此確定裝置的剩餘壽命預測值. 進一步, 為綜合多個LSTM網路預測值, 引入Bayesian模型平均方法, 估計各個模型的後驗機率, 由此可以確定最終的剩餘壽命預測值和預測置信區間, 有效提高了剩餘壽命預測精度的同時以置信區間的形式表示了預測不確定性. 以上思路在基於機器學習方法的剩餘壽命預測不確定性量化方面做出了有益的嘗試, 然而無論是改變輸入條件構建數值分佈、基於均方根誤差構建誤差帶, 還是構建多個預測模型透過Bayesian模型平均構建置信區間, 都更多地反映了網路訓練的效果而不能全面反映裝置效能退化固有的時變隨機性和動態特性.
5)混合深度網路
基於混合深度網路的方法可看作多個深度學習網路以一定方式組合連線(如串聯、並聯等)用於彌補現有單一深度學習網路的不足, 目前主要的混合形式包括深度置信網路 + 前饋神經網路[103]、受限玻爾茲曼機 + LSTM網路[104]、LSTM網路 + 卷積神經網路[105]、LSTM網路 + 編碼−解碼模型[106]、迴圈神經網路 + 自編碼器[107]、多損失編碼器 + 兩階段卷積神經網路[108]等. 這類方法主要透過繼承不同深度學習模型的優勢, 進而期望實現取長補短、改善剩餘壽命預測的效果. 例如: Ren等[109]提出了一種堆疊自編碼器與前饋神經網路組合的軸承剩壽命預測方法, 該方法能夠有效利用堆疊自編碼器在特徵表示方面的優勢, 同時將其引入至前饋神經網路可有效避免訓練過程中的區域性最優問題; Deutsch等[104]提出了一種融合深度置信網路與前饋神經網路的旋轉裝置剩餘壽命預測方法, 這是基於深度置信網路方法的改進和擴充, 能夠有效結合深度置信網路特徵提取能力與前饋神經網路的預測效能. 雖然透過混合深度網路進行剩餘壽命預測有助於產生互補效應, 但混合多種深度網路將不可避免地導致剩餘壽命預測模型的訓練複雜化, 而且混合方式的選擇基本上是啟發式的, 缺乏公認統一的形式. 因此, 發展剩餘壽命預測相關效能要求牽引下的混合深度網路構建方式以提高混合方式的可解釋性仍有待深入研究.
需要說明的是, 基於深度學習的剩餘壽命預測研究正在蓬勃發展, 以上介紹到的文獻僅是冰山一角. 透過對當前相關研究發展動態的分析不難發現, 無論是傳統的基於淺層機器學習還是正在蓬勃發展的基於深度學習的剩餘壽命預測研究, 基本上都可以歸結到兩種思路, 即基於退化量滾動預測和基於學習網路建立監測資料與失效時間端到端的對映. 雖然在以上兩種思路下的剩餘壽命預測方法研究快速發展, 且都屬於資料驅動的方法, 但當前研究面對剩餘壽命預測現實需求時主要存在以下有待解決的問題:
1)目前這些基於機器學習的剩餘壽命預測研究, 基本上都是將其他領域應用需求驅動下提出並發展起來的各種深度網路直接應用, 其網路結構和引數均是確定性的, 一般只能得到確定性的剩餘壽命預測值, 很難得到能夠量化剩餘壽命預測不確定性的機率分佈. 正如第1節所討論的, 剩餘壽命預測針對的是裝置將來的失效事件, 而裝置效能退化在預測區間內受到環境、負載等多重隨機因素影響, 導致剩餘壽命預測結果不可避免地具有不確定性, 因此剩餘壽命預測不確定性的量化表徵是該領域的一個核心問題. 然而, 目前基於機器學習的方法對這方面重視不夠, 在預測不確定性量化能力上存在不足. 無法量化預測不確定性也意味著無法量化預測結果帶來的風險, 由此導致難以滿足以最小化執行風險或最小化費用為目標的健康管理相關決策(如維護決策、備件訂購等)對執行風險定量評估的應用需求[39]. 造成以上問題的根本原因在於所採用的學習網路並不是針對剩餘壽命預測的核心需求設計的, 更多的是直接採用或借鑑其他任務需求下發展起來的學習網路. 因此, 如何設計並發展面向剩餘壽命預測及其不確定性量化需求的專用學習網路, 使得其能夠從監測資料中學習到反映預測不確定性的剩餘壽命機率分佈相關的資訊, 是克服現有研究發展瓶頸的根本途徑和有重要價值的研究方向.
2)現有研究中透過學習網路建立監測資料與失效時間端到端對映以預測剩餘壽命的思路, 其成功實現的前提是能夠獲取充分的同類裝置失效時間資料以製作訓練標籤. 然而, 在工程實際中, 由於受到安全性與經濟性等因素的限制, 裝置執行至失效狀態是極其危險的, 一般在失效前對裝置進行替換. 在該情況下, 所能獲取的更多的是裝置在服役過程中積累的大量狀態監測資料, 關於裝置失效時間的資料幾乎沒有, 因而這類狀態監測大資料大多屬於非全壽命週期型別. 儘管大資料背景下非全壽命週期資料包含了豐富的裝置退化機制與壽命資訊, 但由於失效資料匱乏將導致現有基於機器學習的剩餘壽命預測方法中所需的壽命標籤難以製作(即零壽命標籤問題), 由此為構建監測資料與剩餘壽命之間端到端的對映關係帶來了極大的挑戰. 與此同時, 基於退化量滾動預測的思路以退化量為標籤構建預測模型, 能夠減少對壽命標籤資料的依賴, 但在實現過程中將本身存在誤差的退化量預測值作為預測模型輸入進行滾動預測, 容易造成預測誤差的累積, 進而影響剩餘壽命預測的準確性. 此外, 目前基於以上思路的剩餘壽命預測研究主要針對完整監測資料, 而對於圖2所示的“碎片化、分段的、稀疏的”非完整監測大資料與剩餘壽命之間的對映關係鮮有研究. 因此, 零壽命標籤情形下如何透過非完整監測大資料構建隨機退化裝置剩餘壽命預測模型, 發展剩餘壽命預測研究的新正規化仍有待解決.
3)如前所述, 剩餘壽命預測是銜接裝置健康狀態感知與基於狀態感知資訊實現裝置的個性化精準健康管理的橋樑, 因此剩餘壽命預測方法的可解釋性對於將預測結果用於裝置的健康管理(如預測維護、備件訂購等)至關重要. 然而, 現有基於機器學習的剩餘壽命預測方法透過學習網路建立監測資料與剩餘壽命之間的對映關係, 監測資料與剩餘壽命之間的關係難以顯式表示, 呈現“黑箱” 特點, 難以解釋裝置退化失效機理. 此外, 當前的研究較多地關注了剩餘壽命預測的準確性, 但機器學習模型中超引數的選擇對預測結果的準確性和魯棒性具有重要影響, 預測的效果對調參技巧和經驗有較大的依賴, 而如何合理有效地選擇機器學習模型的超引數在機器學習領域本身就是一個極具挑戰性的問題. 綜合以上兩個方面可見, 發展具有可解釋性的基於機器學習的剩餘壽命預測方法, 將有助於打通當前這類方法從理論研究到推廣應用於裝置健康管理的最後一公里. 提高基於機器學習的剩餘壽命預測方法的可解釋性的研究方向包括在學習網路設計中考慮裝置退化失效的機理知識、基於學習網路從監測資料中提取退化特徵時將特徵的趨勢性或單調性作為約束條件考慮、將超引數的選擇問題轉化為提升預測效果的最佳化問題納入模型訓練過程等。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70021344/viewspace-2915544/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料下數模聯動的隨機退化裝置剩餘壽命預測技術(部分2)大資料隨機
- SSD固態硬碟使用壽命檢測方法 固態硬碟怎麼測剩餘壽命?硬碟
- 電子技術經典資料彙總:手機/移動裝置
- 發電機測試裝置創新技術有哪些?
- 大資料技術 - 監控預警大資料
- Python 隨機(random)模組的不可預測之美Python隨機random
- 加州大學:男性和女性的預期壽命差距越來越大
- 1232: 手機剩餘電量
- Google致力於解決macOS裝置上電池壽命問題GoMac
- 專家觀點∣基於資料驅動的裝置預測性維護
- python 使用 random模組生成隨機測試資料Pythonrandom隨機
- 化妝品效能檢測裝置中的機器視覺技術視覺
- 在 Linux 下使用 fstrim 延長 SSD 驅動器的壽命Linux
- 剩餘引數、擴充運算子
- 大資料測試技術——課堂測試大資料
- 大資料環境下計算機軟體技術分析大資料計算機
- 乾貨 | 餘額寶大規模服務化的技術創新
- 2019 年技術大趨勢預測
- 2022年全球擁有智慧家居裝置家庭數量預測(附原資料表)
- 2027年全球擁有智慧家居裝置家庭數量預測(附原資料表)
- 小資料二級聯動-封裝成一個二級聯動部分檢視封裝
- 機器學習股票價格預測從爬蟲到預測-資料爬取部分機器學習爬蟲
- 模擬手機裝置:使用 Playwright 實現移動端自動化測試
- 監測資料可預測疾病?可穿戴裝置或將不再“雞肋”
- ES6箭頭函式的剩餘引數函式
- 如何檢視ssd壽命?教你macOS 免安裝用指令即可查詢SSD健康度/壽命Mac
- JavaScript 剩餘運算子JavaScript
- 中國剩餘定理
- 2019年5大技術發展預測,區塊鏈這部分你一定要看區塊鏈
- Wi-Fi漏洞影響數十億裝置;吸塵器偷錄視訊;滑動關閉程式縮短iPhone電池壽命iPhone
- 個數是如何用大資料做行為預測的?大資料
- 大資料技術 - Kyuubi大資料
- 大資料技術 - SuperSQL大資料SQL
- 大資料技術 - Directus大資料
- 大資料技術 - Druid大資料UI
- 大資料技術 - Ververica大資料
- 大資料技術 - Phoenix大資料
- 大資料技術 - Azkaban大資料