微軟推Azure機器學習工具

johnchou發表於2021-09-09

來源於:微軟推Azure機器學習工具:Algorithm Cheat Sheet

  Azure Machine Learning Studio 有著大量的機器學習演算法,現在你可以使用它來構建預測分析解決方案。這些演算法可用於一般的機器學習:迴歸分析、分類、聚類和異常檢測,且每一個都可以解決不同型別的機器學習問題。

  現在的問題是,是否有什麼工具之類的東西可幫助找出如何選擇一個合適的機器學習演算法,並根據具體的方案?

  點選這裡檢視大圖。

  點選此處下載 Cheat Sheet:Microsoft Azure Machine Learning Algorithm Cheat Sheet

  微軟 Azure 的機器學習 Algorithm Cheat Sheet 旨在幫助你篩選可用的機器學習演算法,並選擇合適的一個來用於預測分析解決方案。Cheat Sheet 會詢問你這兩個問題:資料的性質、你工作想要解決的問題等,然後提出一個你可以嘗試的演算法的建議。

  Azure Machine Learning Studio 為你提供了靈活的體驗:嘗試一種演算法,如果你對結果不滿意,那就嘗試另一種。(Azure 機器學習是免費的,也不需要什麼許可,點選這裡試用。)這裡有一個來自 Azure Machine Learning Gallery 的例子,該實驗是嘗試用幾種不同的演算法用在相同的資料上,然後進行結果比較:Compare Multi-class Classifiers: Letter recognition。

  • 對於不同型別的機器學習演算法和如何使用的深入討論,參見:How to choose an algorithm in Azure Machine Learning。

  • 所有的機器學習演算法列表都在 Machine Learning Studio 中可獲得,參見:Initialize Model。

  關於 Azure Machine Learning Studio

  Azure Machine Learning Studio 提供了許多不同的先進機器學習演算法來幫助你生成分析模型。首先,確定要執行的機器學習任務的常規型別,因為歸組在每個類別中的演算法適合特定的預測任務。

  選擇一種演算法並配置其引數後,可以使用訓練模組之一透過選定演算法執行資料,也可以使用掃描引數迴圈訪問所有可能的引數並確定任務和資料的最佳配置。

  學習演算法的類別

  Azure Machine Learning Studio 提供了以下各種型別的機器學習演算法,它們按典型的機器學習方案來分組。

  • 異常檢測

  異常檢測包含許多機器學習方面的重要任務,異常檢測技術適用於各種行業:

  1. 標識可能具有欺詐性的事務。

  2. 學習指示發生了網路入侵的模式

  3. 查詢異常的患者群集

  4. 檢查輸入到系統的值

  根據定義,異常屬於罕見事件,因此可能很難收集有代表性的資料樣本來進行建模。本節中包含的演算法已經過專門設計,可以解決異常檢測的核心構建和訓練模型問題。

  此類別包括以下模組:單類支援向量機、基於 PCA 的異常檢測。

  • 分類

  分類演算法用於預測單個資料例項的類或類別。例如,電子郵件篩選器使用二元分類來確定某封電子郵件是否為垃圾郵件。有兩種形式的分類任務。一種是旨在預測兩個結果之一的二元分類,另一種是旨在預測多個結果之一的多類分類。分類演算法的輸出為分類器,可用於預測新的(未標記)例項的標籤。

  類別 Modules References.Machine Learning.Initialize Model.Classification 包括以下模組:多類決策林、多類決策森林、多類邏輯迴歸、多類神經網路、一對多多類、雙類平均感知器、雙類貝葉斯點機、雙類提升決策樹、雙類決策林、雙類決策森林、雙類邏輯迴歸、雙類神經網路、雙類支援向量機、雙類區域性深層支援向量機。

  • 聚類

  聚類演算法可以基於一組特徵學習瞭解如何將一組項分組在一起。例如,聚類通常在文字分析中使用,以便將包含常見單詞的文字片段分組在一起。可以使用聚類透過找出最接近的資料點,然後確定每種組合的質心或中心點,來分組未標記的資料。訓練演算法後,可以使用它來預測資料例項所屬的聚類。

  類別 Modules References.Machine Learning.Initialize Model.Clustering 包括模組:K 平均值聚類

  • 迴歸

  迴歸演算法是學習預測單個資料例項的實際函式字的演算法。例如,房價預測器可以使用迴歸演算法來預測當前的房價。迴歸演算法確定要執行迴歸函式的資料的每個特徵分佈。演算法訓練用於預測標記資料的函式後,可用於預測新的(未標記)例項的標籤。

  類別 Modules References.Machine Learning.Initialize Model.Regression

  相關新聞:

  微軟推出 Azure 平臺機器學習和實時分析服務


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4422/viewspace-2811687/,如需轉載,請註明出處,否則將追究法律責任。

相關文章