通俗講明白機器學習中的學習問題 - svpino

發表於2021-03-02

使用平白語言而不是複雜數學圖表公式講明白監督學習、無監督學習和強化學習、半監督學習、自主學習等關鍵區別。

 

監督學習

監督學習可能是我們都聽說過的最常見的問題類別。我們從示例及其對應標籤(或答案)的資料集開始,然後,我們訓練一種模:在這些示例與相應標籤之間的形成對映。目的是使模型從其所看到的示例中泛化(banq注:從具體看到普遍規律,中國人定義的歸納法),這樣能在以後回答類似的問題。監督學習主要有兩種型別:

  1. 分類:我們預測一個類別標籤
  2. 迴歸:我們預測一個數字標籤 

監督學習的分類:指定一組包含狗圖片及其相應品種的資料集,構建一個AI演算法模型,該模型能在新圖片發現狗品種。注意目標是如何預測類別標籤(狗的品種)。

監督學習的迴歸:指定一組房屋的特徵及其市場價值,構建一個確定新房屋價值的模型。注意目標是如何預測數字標籤(房屋的價值)。

 

無監督學習

無監督學習是關於查詢資料中的關係。此過程不涉及任何標籤。我們不會通過帶有標籤的示例直接教授該演算法。我們希望它可以從資料本身中學習。

無監督學習的示例:指定潛在客戶列表,將其分為不同的細分組,以便您的營銷部門可以與他們聯絡。在這裡,演算法將根據現有關係為您的客戶確定不同的組。

聚類(Clustering)是無監督學習的最常見示例。您可能已經聽說過k-Means是最流行的聚類演算法之一。在此,“ k”代表我們要查詢的聚類數。

 

強化學習

強化學習非常酷:代理與環境互動以收集獎勵。基於這些觀察,代理可以瞭解哪些操作將優化結果(最大化獎勵或最小化懲罰)。

強化學習的示例:機器人通過步行並探索兩個位置之間的不同路徑來學習從倉庫中的A點到B點的方式。每次機器人被卡住都會受到處罰。當達到目標時,就會得到回報。

AlphaZero(Chess)和AlphaGo(Go)可能是最受歡迎的兩種強化學習實施方案。DeepMind是所有這項研究的公司。在他們的網站上檢視一些非常酷的文章。

 

半監督學習

在半監督學習中,我們獲得了很多資料,但只有很少的標籤。有時,甚至我們擁有的標籤也不完全正確。目標是建立一種解決方案,以利用我們擁有的所有資料,包括未標記的資料。

想象一下,您有大量的資料,但是其中大多數沒有標籤。更糟糕的是:進行標籤會非常昂貴。假設我們要根據成熟度對視訊進行分類。我們有數百萬個標籤,但只有少數幾個帶有標籤。標記視訊需要很長時間(您必須完整觀看!)我們也不知道要建立一個好的模型需要多少個視訊。在傳統的監督方法中,我們別無選擇:我們需要花費時間,並拿出一個帶有標籤的視訊的大型資料集來訓練我們的模型。但這並不總是一種選擇。在某些情況下,這可能是專案的結束。

使用主動學習,我們可以讓我們的演算法開始使用已有的資料進行訓練,並根據需要互動地請求新的標記資料。主動學習是一種半監督學習方法。

主動學習:該演算法將檢視所有未標記的資料,並將選擇最有用的示例。然後,它將要求人們標記這些示例,並在培訓過程中使用答案。

確定哪些示例最有用的是有問題的部分。更糟糕的是,我們可以隨機選擇未標記的示例,但這並不明智。選擇過程越好,構建模型所需的資料就越少。

在決定時,我們希望演算法為模型選擇最具挑戰性的示例。以下是一些可以進一步研究的現有方法:

  • -最低置信度不確定度
  • -最小保證金不確定度
  • -熵降低

總而言之,主動學習會反覆訓練模型,以最大程度地減少所需的標記資料量。這可以節省大量資金,有時,差異才使解決方案變得可行。

 

自我監督學習

自我監督學習是無監督學習的子集。這個想法是使用監督學習來解決一個任務(pretext任務),該任務以後可以用來解決原始問題。我們以可以利用現有標籤的方式來構造問題。

自我監督學習問題的三個流行示例:

  1. Autoencoders
  2. 變Transformers
  3. 生成性對抗網路

  

多例項學習

是“監督學習”的子集。此處的區別在於,我們沒有為每個特定示例新增標籤,而是為示例組新增了標籤。這些組稱為“袋bags.”。

多例項學習模型著重於根據袋子中包含的各個例項來預測袋子的類別。這種型別的問題的一個例子是基於內容的影像檢索,我們的目標是基於其中包含的物件來查詢影像。

每當遇到問題時,只要能夠根據問題的特徵識別其型別,就可以確定潛在的解決方案。這是理解這些型別的機器學習問題和可能的應用程式的價值。

 

相關文章