大資料下數模聯動的隨機退化裝置剩餘壽命預測技術(部分2)
4. 統計資料驅動的剩餘壽命預測
傳統統計資料驅動的剩餘壽命預測方法透過對裝置失效時間資料統計分析, 構造壽命TT的分佈函式, 由此裝置在tt時刻的剩餘壽命即為 T−t|T>t,zT−t|T>t,z, 其中zz代表該類裝置的事件資料集(主要指失效時間資料), 然後透過分佈擬合得到壽命TT的機率分佈, 再透過上述條件隨機變數的關係實現剩餘壽命預測[110]. 然而, 隨著生產製造水平的不斷提升, 裝置的可靠性逐步提高, 很難在短期內(即使是加速條件下)獲得足夠多的失效資料或對於昂貴的裝置獲取成本過高, 而且這類方法沒有用到裝置執行過程中的監測資料, 預測結果難以反映當前執行實際情況, 由此導致難以實現個體服役裝置的精準健康管理.
相比之下, 隨著資訊科技和感測器技術的迅猛發展, 透過裝置效能退化變數的監測資料, 建立描述裝置效能演化過程的隨機模型, 便可預測裝置剩餘壽命[111]. 這類方法以機率統計理論為基礎, 在隨機模型框架下建模效能退化變數演變規律, 以機率分佈的形式給出剩餘壽命分佈的表示式, 不僅能得到剩餘壽命的點估計, 而且能描述預測的不確定性(方差、置信區間等各種不確定性量化指標), 這對維修、替換、後勤保障等的科學決策極為重要, 因而已成為國內外研究的熱點.
基於隨機模型建模效能退化變數監測資料的關鍵是選擇合適的隨機模型, 常用的隨機模型主要指各種隨機過程模型, 包括Wiener過程、Gamma過程、Markov鏈、隱Markov過程和逆高斯過程等[112-115]. 這類方法採用隨機過程描述效能退化變數的演變過程, 透過監測資料實現模型引數的估計, 基於此透過求解所建立的隨機退化過程首達失效閾值時間的機率分佈實現剩餘壽命預測, 在剩餘壽命預測不確定性量化方面具有天然優勢. 從物理機制看, 裝置退化是其內部應力和外部環境綜合作用而引起的裝置老化和效能衰變, 與取樣時間和取樣頻率無關, 亦即裝置的退化過程應該滿足無限可分性. 迄今, 從數學上已證明滿足無限可分性的隨機過程模型只有Gamma過程、逆高斯過程和Wiener過程[116-117]. 因此, 利用這三類隨機過程建立裝置退化模型, 在數學上和物理上均具有較強的可解釋性, 受到了國內外研究者的廣泛關注[118-119]. 然而, 前兩種隨機過程都是單調隨機過程, 只能描述單調退化, 例如磨損、疲勞裂紋增長等. 在實際中, 由於裝置內部應力的吸收與釋放、使用強度、使用頻率、載荷大小、外界環境等的動態變化, 效能退化變數的監測訊號往往呈現非單調波動的特點, 而Wiener過程是由Brownian運動驅動的一類擴散過程, 其增量獨立且為高斯分佈, 適合刻畫非單調退化過程, 在退化測量訊號的建模上更具靈活性, 因此廣泛應用於滾動軸承、液晶顯示器、鐳射器、慣性器件等的退化建模及剩餘壽命預測. 2018年, Zhang等[120]系統全面地總結了基於Wiener過程的各種退化建模及剩餘壽命預測方法最新研究進展情況.
目前, 這類基於隨機過程的方法主要針對圖2所示的完整監測資料, 且需要能夠從監測資料中提取具有一定趨勢特徵的效能退化變數, 以確定所採用隨機過程的引數化形式並基於監測資料實現隨機過程模型引數辨識, 最終透過求解隨機過程首達失效閾值時間的機率分佈達到預測剩餘壽命的目的. 根據建模過程中涉及的效能退化變數數目, 主要分為單變數模型和多變數模型兩種情況.
單變數下隨機退化裝置剩餘壽命預測研究得到了廣泛關注和深入研究. Gebraeel等[121]以軸承振動資料為背景, 將裝置退化資料演化過程描述為線性Wiener過程, 最早將Bayesian更新策略用於剩餘壽命分佈的線上遞迴預測. Huang等[122]透過採用時間尺度變換線性化技術研究了一類基於一般Wiener隨機退化過程的剩餘壽命預測問題, 提出了漂移係數自適應更新方法; 為處理本質非線性退化資料, Si等[123]提出了一類一般非線性擴散過程模型描述退化資料, 透過時間−空間變換, 得到了剩餘壽命分佈的解析形式, 並將所得結果應用於慣性平臺的漂移退化和2017-T4鋁合金的疲勞裂紋增長. 在文獻[123]基礎之上, 出現了諸多的理論擴充套件及應用研究[124-125]. 最新出版的學術專著 [126] 對基於Wiener過程及其變形開展的單變數下隨機退化裝置剩餘壽命預測基礎理論和方法, 從線性到非線性、從固定模式到切換模式進行了詳細的論述.
在工程實際中, 裝置存在執行工況、執行環境、執行負載多變等複雜執行模式, 反映裝置效能退化的變數往往不止一個且相互關聯, 呈現多效能退化變數的特點, 表徵裝置健康狀態的效能退化指標往往並不唯一. 文獻[127]在Bayesian框架下研究了多變數動態系統的可靠性估計問題, 但將各個變數單獨建模, 未考慮多退化變數之間相互耦合的實際. 當前, 對多變數耦合的情況主要有兩種思路. 第1種是基於Copula函式的方法. 其中, Copula函式是一種連線多維聯合分佈與一維邊緣分佈的特殊函式, 基於此函式, 多個相關退化量的聯合分佈可以透過每個退化量的邊緣分佈和Copula函式融合為一個整體分佈[128]. Pan等[129]、Peng等[130]、劉勝南等[131]、張建勳等[132]採用不同的隨機過程模型和Copula函式研究了多元退化變數的建模問題, 並用於剩餘壽命預測. 然而, 基於Copula函式的方法成功應用的關鍵在於Copula函式的選擇, 不同的退化資料常常適用於不同的Copula函式, 而且可供選擇的Copula函式形式是非常有限的, 選擇的過程有一定的主觀性, 選擇結果也不唯一, 因此這類方法難以對多個效能退化變數之間的相互作用關係進行合理的定量描述. 第2種是基於資訊融合的方法. 這種方法的主要思路是在進行退化建模之前, 首先根據多維資料之間的關係, 透過最佳化、加權、融合濾波等方式, 將多維資料投影變換到一維資料上來, 提取一個單變數複合效能指標, 再應用已有針對單變數的方法對此一維資料進行建模和預測. 例如, Liu等先後提出了基於退化訊號加權組合[133-134]、基於訊號質量最佳化[135]、基於多源資訊融合[136-137]的複合效能指標獲取方法, 據此採用單變數退化建模方法實現剩餘壽命預測. 此類方法的優點在於融合後的效能指標可以採用傳統針對單變數的退化建模和剩餘壽命預測方法. 然而, 在多維資料融合時其相互之間的關係一般難以界定, 使得融合後的指標難以全面反映整個裝置的退化, 而且融合後的指標物理意義不明確, 導致退化失效閾值的確定成為一個新的難題.
透過以上文獻分析可以看出, 統計資料驅動方法以機率統計理論為基礎, 利用隨機模型對監測資料進行建模, 進而對剩餘壽命進行推斷, 可以得到剩餘壽命的機率分佈, 在量化剩餘壽命預測不確定性上具有天然優勢, 且隨機模型引數與裝置退化失效過程緊密相關使得模型可解釋性較強(如反映退化快慢的退化率引數、反映退化過程時變不確定性的擴散係數等), 因此得到了可靠性領域學者的大力推崇, 發展迅速. 但需要注意到的是, 無論是單變數下還是多變數下, 這類方法主要針對圖2所示的完整監測資料且需要能夠從監測資料中提取具有一定統計特徵的退化趨勢資料以實現引數化的演變軌跡建模. 然而, 在大資料時代, 通常採用感測器網路收集多物理源訊號以全面反映裝置狀態, 由於多源訊號差異大、取樣策略形式多, 資料價值密度低, 導致資料質量參差不齊, 現有統計資料驅動的方法從大資料中提取退化特徵資訊如同大海撈針, 處理如圖2所示的“碎片化、分段的、稀疏的”監測大資料更是難上加難, 沒有良好統計特徵的退化資料做輸入, 這類方法必將迷失於浩瀚的資料海洋. 此外, 單變數下隨機退化裝置剩餘壽命預測研究試圖提取單一特徵表徵裝置健康狀態全貌的思路, 已與複雜執行條件下裝置健康狀態需從多維度表徵的需求不相適應, 而現有多變數下隨機退化裝置剩餘壽命預測問題的研究基本都是試圖透過轉換為單變數情況再來處理, 未充分考慮多效能退化變數相互耦合、相互影響的機制, 多變數耦合導致的剩餘壽命分佈求解難題仍未能得到有效解決. 因此, 針對大資料環境下隨機退化裝置的剩餘壽命預測問題, 發展新的理論和方法勢在必行.
5. 機器學習方法與統計資料驅動方法相結合的剩餘壽命預測
透過第3節和第4節的文獻分析可以看出, 以深度學習為代表的機器學習方法在監測大資料深層次特徵自動提取、複雜結構資料擬合、非線性對映等方面具有強大的處理能力, 但很難得到體現剩餘壽命預測不確定性的機率分佈, 這與其強大的資料處理能力和學習能力還不相匹配. 統計資料驅動的方法雖能得到剩餘壽命的機率分佈、在量化剩餘壽命預測不確定性上具有天然優勢, 但對具有多源訊號差異大、取樣策略形式多、資料價值密度低、資料質量參差不齊等特點的監測大資料處理能力非常有限. 因此, 若能將機器學習方法與統計資料驅動方法相結合, 有望綜合兩者的優勢、彌補各自侷限性. 最近, 一些學者也開始了這方面的探索性研究. Deutsch等[138]將深度置信網路用於提取退化特徵, 然後用隨機退化模型表示特徵的演變趨勢, 利用粒子濾波演算法實現模型更新, 並得到了剩餘壽命機率分佈的數值形式. 彭開香等[139]研究提出了一種基於深度置信網路的無監督健康指標構建方法, 並結合隱馬爾可夫模型對特徵進行建模用於剩餘壽命預測. 進一步, 該方法被改進為深度置信網路與粒子濾波相結合的形式[140], 可以實現剩餘壽命機率分佈的數值計算. 最近, Hu等[141]利用深度置信網路的無監督學習特性構建效能退化指標, 然後採用非線性擴散過程建模效能退化指標演變趨勢, 從而得到了剩餘壽命的機率分佈.
這些研究在做出了有益嘗試的同時, 還存在不容忽視的侷限性: 1)以上方法中深度網路用於特徵提取而隨機模型用於建模特徵實現剩餘壽命的機率分佈輸出, 但在實現過程中特徵提取和模型建立是孤立進行的, 由此導致機器學習方法和統計資料驅動方法實際是簡單的組合關係, 提取的深度退化特徵能否適應並匹配所採用的隨機模型仍是問題, 因為在特徵提取過程中並沒有考慮提取後採用何種形式的模型對其建模表徵; 2)深度網路通常可以從監測大資料中提取深層次、多維度的退化特徵, 但以上方法透過指標篩選技術從多維度特徵中選擇單個特徵用於隨機退化建模, 由此這類方法還存在第4節討論的所選單一特徵難以表徵裝置健康狀態全貌、未考慮多變數耦合下剩餘壽命分佈求解等問題; 3)透過深度網路從大資料中提取的退化特徵實際上是虛擬退化指標, 物理意義不明確, 由此導致這些退化指標所對應的失效閾值確定成為一個新的難題.
透過上述分析可見, 若能綜合統計資料驅動方法在預測不確定性量化能力上的優勢與機器學習方法在大資料處理能力上的優勢, 實現互動聯動、交叉融合、強強聯合, 發展大資料環境下隨機退化裝置剩餘壽命預測新理論與新方法, 有望為大資料時代裝置剩餘壽命預測與健康管理打造一把利器. 然而, 現有為數不多的綜合機器學習方法和統計資料驅動方法的剩餘壽命預測研究中, 基於監測資料的退化特徵提取過程與所提取特徵的隨機過程建模是孤立進行的, 由此導致機器學習方法和統計資料驅動方法實際上是簡單的組合關係. 此外, 這些研究中提取退化特徵的過程中主要關注了特徵本身的特性(如單調性、趨勢性等), 但如此提取的特徵能否適應並匹配所採用的隨機過程模型並不能保證. 因此, 發展大資料下退化特徵提取與隨機退化建模互動聯動的剩餘壽命預測方法, 將有助於形成大資料下剩餘壽命預測研究的新模式.
學習和關注人工智慧技術與諮詢,瞭解更多資訊!
更多詳情可諮詢175-3102-1189,或到我司官網瞭解:。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70021344/viewspace-2915893/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料下數模聯動的隨機退化裝置剩餘壽命預測技術(部分)大資料隨機
- SSD固態硬碟使用壽命檢測方法 固態硬碟怎麼測剩餘壽命?硬碟
- 電子技術經典資料彙總:手機/移動裝置
- BZOJ5118: Fib數列2(二次剩餘)
- 發電機測試裝置創新技術有哪些?
- 大資料技術 - 監控預警大資料
- Python 隨機(random)模組的不可預測之美Python隨機random
- 加州大學:男性和女性的預期壽命差距越來越大
- 1232: 手機剩餘電量
- Google致力於解決macOS裝置上電池壽命問題GoMac
- 專家觀點∣基於資料驅動的裝置預測性維護
- python 使用 random模組生成隨機測試資料Pythonrandom隨機
- 化妝品效能檢測裝置中的機器視覺技術視覺
- 在 Linux 下使用 fstrim 延長 SSD 驅動器的壽命Linux
- 剩餘引數、擴充運算子
- 大資料測試技術——課堂測試大資料
- 大資料環境下計算機軟體技術分析大資料計算機
- 乾貨 | 餘額寶大規模服務化的技術創新
- 2019 年技術大趨勢預測
- 2022年全球擁有智慧家居裝置家庭數量預測(附原資料表)
- 2027年全球擁有智慧家居裝置家庭數量預測(附原資料表)
- 小資料二級聯動-封裝成一個二級聯動部分檢視封裝
- 機器學習股票價格預測從爬蟲到預測-資料爬取部分機器學習爬蟲
- 模擬手機裝置:使用 Playwright 實現移動端自動化測試
- 2023年全球主要B2B技術支出預測(附原資料表)
- 2027年全球主要B2B技術支出預測(附原資料表)
- 監測資料可預測疾病?可穿戴裝置或將不再“雞肋”
- ES6箭頭函式的剩餘引數函式
- 美國CDC:2020年美國人均預期壽命縮短近2年
- 如何檢視ssd壽命?教你macOS 免安裝用指令即可查詢SSD健康度/壽命Mac
- JavaScript 剩餘運算子JavaScript
- 中國剩餘定理
- 2019年5大技術發展預測,區塊鏈這部分你一定要看區塊鏈
- Wi-Fi漏洞影響數十億裝置;吸塵器偷錄視訊;滑動關閉程式縮短iPhone電池壽命iPhone
- 個數是如何用大資料做行為預測的?大資料
- 大資料技術 - Kyuubi大資料
- 大資料技術 - SuperSQL大資料SQL
- 大資料技術 - Directus大資料