關於如何使用機器學習來做異常檢測的7個問題
導讀
異常檢測的一些入門問題。
問問題是學習的好方法之一。但有時你不知道從哪裡開始,或者該問什麼 —— 尤其是在你還比較熟悉的異常檢測之類的話題上。在這種情況下,最好傾聽別人的問題,讓他們的思路來指導你的學習。以下是我們在“[Ask Me Anything: Anomaly Detection]( anything-webinar-anomaly-detecing-machine -learning)”網路研討會上收到的一些問題,可以幫助你入門。
離群點和異常值的區別是什麼?
離群值是遠離分佈的位置或者平均值的觀測值。然而,它們並不一定代表異常行為或由不同過程產生的行為。另一方面,異常是由不同的過程生成的資料模式。
異常檢測在藥品中有什麼應用嗎?
異常檢測在藥物生命科學領域有許多應用。包括在製藥生產中使用統計過程控制(SPC)或質量控制(QC)和多元過程控制(MSPC)圖表進行過程監控和質量控制。及時發現異常是避免異常事件發生,遵守安全標準的關鍵。發現櫃檯交易中的異常情況,可以用來打擊醫藥零售資料中的處方濫用。實時檢測多引數臨床試驗資料中的異常,有助於保證臨床試驗的成功。
GANs也用於異常檢測嗎?如果是的話,能否提供一個行業用例
生成對抗網路(GANs)是一種新的無監督學習方法,在識別異常方面非常有效。由於GANs是設計成迭代的,並且對抗性訓練的目的是利用重構樣本來最佳化減少殘差損失,因此它們在半結構化和非結構化資料中工作得很好。它們在醫學影像分析(幫助放射學家發現難以識別的腫瘤)、面部識別、文字影像轉換等方面非常有用。
資料相關性會影響異常檢測嗎?我們可以用什麼方法,怎樣減少這些影響?是否最好在開始異常檢測之前清除和刪除關聯資料?
正如在網路研討會上提到的,我們不認為相關性會影響異常檢測,但我們有許多可用的技術來幫助確定如何處理相關變數。一個建議是使用主成分分析(PCA)這樣的技術來減少維數。
建議使用什麼樣的演算法適合於檢測與識別網路活動或資料中的不尋常活動有關的異常?
正如在網路研討會上提到的,有許多方法和演算法可以很好地用於異常檢測的各種應用和用例。其中有遞迴神經網路(RNN)、生成對抗網路(GAN)、隔離森林、深度自編碼器等。如果你對網路/圖分析特別感興趣,用來識別網路圖異常的兩種主要方法是直接鄰居離群點檢測演算法(DNODA)和社群鄰居演算法(CNA)。
在我目前的工作中,“新穎性”是我們努力去發現的主要東西。質量控制圖對於已知的模式很有效,但是自動識別新模式比較困難。我希望能得到一些在這方面有所幫助的工具的想法。
對於單變數質量控制圖,西方的電氣規則可以用於檢測少數常見的模式。經典的多元方法,如偏最小二乘(PLS),會捕獲到涉及不止一個變數的模式,但不能被單變數方法檢測。自動編碼器是最全面的工具,將涵蓋最廣泛的不同模式。它可以捕獲多變數、迴圈、非線性和互動的模式。你使用一組正常資料訓練autoencoder,在訓練集中沒有出現的新資料中出現的任何模式都將被標記。
透過做PCA來減少維度會影響資料集中的異常嗎?它會導致異常現象的消失嗎?如果是這樣,如何預防呢?
做PCA將會在原始資料集中捕獲一些百分比的方差。因此,我們使用PCA進行異常檢測的方法是計算原始點到低維空間中表示的點的“距離”。距離越大(即在將觀測結果對映到低維空間時“丟失”的越多),我們就越認為它是一種異常。
https://blog.csdn.net/weixin_42137700/article/details/107661456
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2707708/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【機器學習】李宏毅——Anomaly Detection(異常檢測)機器學習
- 吳恩達機器學習筆記 —— 16 異常點檢測吳恩達機器學習筆記
- 【機器學習】吳恩達機器學習中文版筆記:異常檢測(Anomaly Detection)機器學習吳恩達筆記
- 關於機器視覺學習路線的問題?視覺
- 關於軟體測試的7個核心問題
- Python機器學習筆記:異常點檢測演算法——LOF(Local Outiler Factor)Python機器學習筆記演算法
- 關於ImageView的幾個常見問題View
- 關於Java異常最常見的八大問題Java
- 5個專注於檢測和預測異常的Java工具分享Java
- 異常檢測
- 一文讀懂!異常檢測全攻略!從統計方法到機器學習 ⛵機器學習
- 如何在實際場景中使用異常檢測?阿里雲Prometheus智慧檢測運算元來了阿里Prometheus
- 序列異常檢測
- 基於多模態對抗學習的無監督時間序列異常檢測
- 複雜異常檢測如何快速落地?看看百度怎麼做
- 從 Quora 的 187 個問題中學習機器學習和 NLP機器學習
- 【機器學習基礎】關於深度學習的Tips機器學習深度學習
- 關於社會機器學習機器學習
- [個人筆記] 關於linux的常見問題合集筆記Linux
- 關於PaddleSharp GPU使用 常見問題記錄GPU
- win10 異常關機檢視方法 win10 異常關機日誌怎麼看Win10
- 機器學習:迴歸問題機器學習
- 面試Python機器學習時,常見的十個面試題Python機器學習面試題
- python 來做數學問題Python
- SpringBoot中關於Mybatis使用的三個問題Spring BootMyBatis
- 工業相機使用常見的8個問題
- 有關超聲波感測器的常見問題解答
- 關於機器學習你必須瞭解的十個真相機器學習
- 一個SMMU記憶體訪問異常的問題記憶體
- [20190320]關於使用smem檢視記憶體使用的問題.txt記憶體
- 機器學習處理問題如何選擇一個合適的演算法?機器學習演算法
- 【機器學習】關於機器學習那些你不知道的“民間智慧”機器學習
- 通俗講明白機器學習中的學習問題 - svpino機器學習
- MySQL關於事務常見的問題MySql
- 關於軟體測試七個核心問題
- 機器學習問題方法總結機器學習
- 機器學習之分類問題度量機器學習
- 關於機器學習的三個思考丨產品雜談系列機器學習