寶信利用Spark Analytics Zoo對基於LSTM的時間序列異常檢測的探索

机器之心發表於2018-09-28

原文網址 : https://www.jiqizhixin.com/articles/2018-09-28-13

摘要：寶信和英特爾相關團隊利用Analytics Zoo在無監督的基於時間序列異常檢測用例上進行了有益的合作探索，本文分享了合作專案的結果和經驗。

背景

在工業製造行業，有多種方法來避免由於裝置失效導致的生產中斷。常見的方法是定期檢修維護，或者提前更換裝置零部件，這些方法都可能會增加裝置維護和更換的投入。然而，另一個可行的方法是收集不同裝置的大量振動資料，並使用這些資料自動檢測裝置狀態的異常。因此，有效地收集大量的時間序列資料並且大規模地進行異常和失效檢測，對於降低工業製造行業中的的很多不必要的成本是非常關鍵的。

Recurrent neural networks (RNNs)迴圈神經網路，特別是Long short term memory models (LSTMs)長短期記憶模型現在被廣泛應用於訊號處理，時間序列分析等場景。作為connectionist模型，RNNs可以提取網路節點中的動態序列。在這個專案中，我們利用LSTM來模擬震動訊號的統計學規律，並且使用了來自辛辛那提大學的IMS全生命週期資料 (http://ti.arc.nasa.gov/c/3/)來展示裝置異常檢測的分析流程。

Analytics Zoo解決方案

Analytics Zoo (https://github.com/intel-analytics/analytics-zoo)是一個基於Apache Spark和BigDL等構建的analytics（分析）+AI（人工智慧）的平臺，由英特爾開源，該平臺能夠方便地讓使用者將端到端的基於大資料的深度學習應用直接部署在已有的Hadoop/Spark的大資料叢集上，而無需安裝專用的GPU裝置。

我們已經在Apache Spark和Analytics Zoo上建立了端到端的基於LSTM的異常檢測流程，可以應用於大規模時間序列資料的無監督深度學習。作為LSTM模型的輸入資料的是一系列裝置震動訊號，比如在當前時間點之前50秒的訊號資料，通過這些訊號資料，經過訓練的模型可以預測下一個資料點。當下一個資料點和模型預測的資料點有較大偏差，我們認為該資料為異常資料。圖1所示為一個端到端的資料處理流程。

寶信利用Spark Analytics Zoo對基於LSTM的時間序列異常檢測的探索圖1：基於Analytics Zoo的振動時間序列異常檢測處理流程.

1.處理流程從Spark叢集讀取原始資料並構造RDD（resilient distributed datasets）彈性分散式資料集，並抽取特徵，最後把特徵輸出到Dataframe。在原始資料集中，每個資料描述了一個檢測失效（test-to-failure）的實驗，幷包含了時長為1秒的20K赫茲取樣的即時振動訊號（如圖2所示）。為了訓練深度學習模型，每一秒的統計資料被提取作為特徵資料，包括均方根（Root Mean Square），峰度（Kurtosis），峰值（ Peak）, 以及小波包分解得到的8個頻段的能量值。

2.處理流程進一步在RDD中處理這些特徵資料，包括數值的小波去噪處理、標準化處理（normalize）和滑動平均處理，以50秒為基準展開特徵資料序列，以便於深度學習模型可以通過前50秒的模式來預測下一個資料點，並最終把資料轉換為Sample RDD。(https://bigdl-project.github.io/master/#APIGuide/Data/#sample).

3.處理流程使用Analytics Zoo中提供的類KerasAPI來建立時間序列異常檢測模型，包括如圖所示的三個LSTM層和一個密集層，並通過資料訓練這個模型（前50個點訓練下一個點）。

val model = Sequential[Float]()
model.add(LSTM[Float](8, returnSequences = true, inputShape = inputShape))
model.add(Dropout[Float](0.2))
model.add(LSTM[Float](32, returnSequences = true))
model.add(Dropout[Float](0.2))
model.add(LSTM[Float](15, returnSequences = false))
model.add(Dropout[Float](0.2))
model.add(Dense[Float](outputDim = 1))

4.接下來是模型評估：使用測試資料或者全部資料來檢測異常。異常資料是指遠離RNN模型預測的資料點。在這個專案中，我們指定異常資料為整體資料集的10%，也就是距離模型預測數值最遠的那10%資料為異常資料。這個篩選比例設定為可調整引數，可以為每個單獨案例進行調整。

寶信利用Spark Analytics Zoo對基於LSTM的時間序列異常檢測的探索

圖2：時間點2004.02.13.14.32.39上四通道的振動資料

測試結果

圖3顯示了原始振動資料和LSTM模型預測資料的對比。只有峰值和均方根這兩個統計數值顯示出來，其他統計數值具有相似的波動。圖中所示紅點為被識別的異常資料，橙色線條為LSTM模型的預測數值，藍色線條為原始數值。經過訓練的模型最終成功預測了裝置的失效，以及在經過600個時間點之後的震動尖峰，在時間序列早期的一些波動可以作為裝置失效的預警資訊。

寶信利用Spark Analytics Zoo對基於LSTM的時間序列異常檢測的探索

寶信利用Spark Analytics Zoo對基於LSTM的時間序列異常檢測的探索圖3: RNN預測數值和原始震動數值的比較

結論

通過利用無監督深度學習，以及Analytics Zoo提供的端到端處理流程，我們可以有效地在大資料集和標準大資料叢集（Hadoop, Spark等）上應用時間序列異常檢測。通過收集、處理大量的時間序列資料（比如日誌，感測器讀數等），應用RNN來學習資料模式，最終預判資料和判定異常資料，Analytics Zoo提供的端到端處理流程能夠為許多新興的智慧系統如智慧製造、智慧運維、物聯網等提供解決方案。基於時間序列的異常檢測在裝置的智慧監控和預測性維護上可以得到重要應用。

參考文獻

1.https://github.com/intel-analytics/analytics-zoo

2. https://github.com/intel-analytics/BigDL

3. https://www.kaggle.com/victorambonati/unsupervised-anomaly-detection

4. https://iwringer.wordpress.com/2015/11/17/anomaly-detection-concepts-and-techniques/

基於多模態對抗學習的無監督時間序列異常檢測
2022-08-04
[譯] 時間序列異常檢測演算法
2019-03-03
演算法
序列異常檢測
2021-09-09
基於Intel Analytics Zoo上分散式TensorFlow的美的 / KUKA工業檢測平臺
2018-09-28
Intel分散式
[譯] 時間順序的價格異常檢測
2019-03-26
基於WOA最佳化的CNN-LSTM的時間序列迴歸預測matlab模擬
2024-08-19
CNNMatlab
基於時間序列檢測演算法的智慧報警實現
2019-03-04
演算法
基於WOA最佳化的CNN-LSTM-Attention的時間序列迴歸預測matlab模擬
2024-05-06
CNNMatlab
基於PSO粒子群最佳化的CNN-LSTM的時間序列迴歸預測matlab模擬
2024-07-04
CNNMatlab
案例剖析：利用LSTM深層神經網路進行時間序列預測
2018-09-10
神經網路
BiTCN：基於卷積網路的多元時間序列預測
2024-05-14
卷積
基於Liquid State Machine的時間序列預測:利用儲備池計算實現高效建模
2024-11-05
UIMac
SiMBA：基於Mamba的跨影像和多元時間序列的預測模型
2024-03-31
模型
時間序列神器之爭：prophet VS lstm
2020-06-11
谷歌的時間序列預測的基礎模型TimesFM詳解和對比測試
2024-07-18
谷歌模型
[python] 基於PyOD庫實現資料異常檢測
2024-10-01
Python
異常檢測
2024-07-26
基於實時計算（Flink）與高斯模型構建實時異常檢測系統
2019-03-11
模型
基於CarbonData的電信時空大資料探索
2021-11-25
大資料
準實時異常檢測系統
2019-02-26
Office Depot使用Apache Spark和Analytics Zoo上的分散式Keras實現實時產品推薦
2019-09-03
ApacheSpark分散式Keras
基於對比稀疏擾動技術的時間序列解釋框架 ContraLSP
2024-05-31
框架
基於知識圖譜與異常檢測的PG資料庫故障定位
2024-02-20
資料庫
將VAE用於時間序列：生成時間序列的合成資料
2024-08-17
時間序列結構變化分析：Python實現時間序列變化點檢測
2024-09-08
Python
5個專注於檢測和預測異常的Java工具分享
2021-12-15
Java
DataPipeline王睿：業務異常實時自動化檢測 — 基於人工智慧的系統實戰
2020-02-28
API人工智慧
基於圖論的時間序列資料平穩性與連通性分析：利用圖形、數學和 Python 揭示時間序列資料中的隱藏模式
2024-10-30
圖論Python模式
基於深度學習的時間序列分類[含程式碼]
2019-03-12
深度學習
AngClust：基於角度特徵的短時間序列基因表達譜聚類（時間序列資料的聚類軟體）
2024-12-01
GC特徵聚類
Talroo使用Analytics Zoo和AWS利用深度學習在工作推薦上的應用
2019-04-12
深度學習
時間序列預測:探索性資料分析和特徵工程的實用指南
2024-05-15
特徵工程
自動化時序異常檢測的可擴充套件通用框架
2019-03-13
套件框架
基於WOA最佳化的CNN-GRU-Attention的時間序列迴歸預測matlab模擬
2024-05-05
CNNMatlab
基於GA最佳化的CNN-GRU-Attention的時間序列迴歸預測matlab模擬
2024-03-26
CNNMatlab
基於GWO灰狼最佳化的CNN-GRU的時間序列迴歸預測matlab模擬
2024-08-11
CNNMatlab
華為AGC提包檢測報告：檢測異常
2021-07-13
GC
基於GA遺傳最佳化的CNN-GRU的時間序列迴歸預測matlab模擬
2024-06-10
CNNMatlab

寶信利用Spark Analytics Zoo對基於LSTM的時間序列異常檢測的探索

背景

Analytics Zoo解決方案

測試結果

結論

參考文獻

相關文章