關於機器學習需要了解的知識

CDA 資料分析師發表於2019-03-06


當我們要學習人工智慧的時候,我們需要學習很多的知識,比如機器學習、深度學習等。一般來說,機器學習是人工智慧的核心知識,要想學好人工智慧就必須重視機器學習的知識。在這篇文章中我們給大家介紹一下關於機器學習需要了解的知識。

當然,說到機器學習就必須要說一下機器學習演算法,在機器學習演算法中,尤其是神經網路被認為是新的人工智慧革命的起因。而機器學習中涉及到了增強學習,那麼什麼是增強學習呢?資料驅動演算法可以分為三類:監督式、非監督式和增強學習。監督式學習和非監督式學習通常用於執行諸如影像分類、檢測等任務,雖然它們的精確度是顯著的,但這些任務不同於我們所期望的智慧。而這些就是增強學習的來源。而增強學習的原理還是很簡單的,環境給agent一個正確的東西給予獎勵,並且對於錯誤的東西來懲罰它。

下面我們就給大家介紹一下增強學習中的演算法,有兩種應用廣泛的增強學習演算法,分別是Q Learning和Deep Q Learning,其中Q Learning是一種應用廣泛的增強學習演算法。如果不進行詳細的數學運算,給定的動作質量取決於agent處於什麼狀態。agent通常執行給予最大回報的操作。當然,在這個演算法中,agent根據環境給予多少回報來學習每個動作的質量。每個環境的狀態值以及Q值通常儲存在表中。當agent與環境互動時,Q值從隨機值更新到實際上有助於最大化回報的值。而Deep Q Learning則是Q Learning的擴充,這是因為Q Learning的使用表的問題在於它不能很好地擴充套件。如果狀態數太高,該表將不適合於記憶體。這就是Deep Q Learning可以應用的地方。深度學習基本上是一種通用的近似機器,它能理解抽象的表示。深度學習可以用來近似Q值,也可以通過梯度下降學習Q值。

在增強學習中,在訓練資料的情況下總會有經驗回放,這是因為在訓練神經網路時,資料不平衡起著非常重要的作用。如果一個模型被訓練,當agent與環境互動時,就會出現不平衡。所以,所有狀態以及相關資料都儲存在記憶體中,神經網路可以隨機選取一批互動和學習。

那麼增強學習有什麼延伸的方面呢?其實增強學習有很多的功能,能很好地處理許多事情,但是在反饋稀疏的地方通常會失敗。agent不會長期探索實際有益的行為。有時,為了自身的緣故而不是直接嘗試解決問題,需要採取一些行動。因為這樣做可以讓agent執行復雜的操作,基本上允許agent計劃事情。在這種設定中,有兩個Q網路。它們被表示為控制器和元控制器。 元控制器檢視原始狀態並計算要遵循的目標。 控制器與目標一起進入狀態,並輸出策略來解決目標。檢查是否達成目標,並向控制器給予回報。 當片段結束或達到目標時,控制器停止。然後,元控制器選擇一個新目標,並重復這個目標。

在這篇文章中我們簡單給大家介紹了關於機器學習需要了解的知識,具體的內容就是關於增強學習的一些知識。通過這些內容我們可以更深入地瞭解深度學習的知識,希望這篇文章能夠更好地幫助到大家。

相關文章