強化學習與其他機器學習方法有什麼不同?

CDA 資料分析師發表於2019-03-06


我們都知道,人工智慧是一個十分重要的技術,現在很多的大型科技公司都開始重視人工智慧的發展。人工智慧的發展不是空穴開風,是因為機器學習使得人工智慧有了飛躍的發展。其實機器學習的方法有很多,在這篇文章中我們就重點說一下機器學習中的強化學習。強化學習是機器學習中一個十分重要的方法,那強化學習與其他機器學習方法究竟有什麼不同呢?下面我們就給大家解答一下這個問題。

首先我們給大家介紹一下什麼是強化學習,其實強化學習又稱再勵學習、評價學習,是一種重要的機器學習方法,在智慧控制機器人及分析預測等領域有許多應用。在傳統的機器學習分類中沒有提到過強化學習,而在連線主義學習中,把學習演算法分為三種型別,即非監督學習、監督學習和強化學習。

那麼強化學習與別的演算法有什麼區別呢?首先我們給大家說一下監督學習和強化學習的區別,在監督學習中,在外部有一個“監督主管”,它擁有所有環境的知識,並且與智慧體一起共享這個知識,從而幫助智慧體完成任務。但是這樣存在一些問題,因為在一個任務中,其中存在如此多的子任務之間的組合,智慧體應該執行並且實現目標。所以,建立一個“監督主管”幾乎是不切實際的。在這些問題中,從自己的經驗中學習,並且獲得知識是更加合理可行的。這就是強化學習和監督學習的主要區別。在監督學習和強化學習中,在輸入和輸出之間都存在對映。但是在強化學習中,存在的是對智慧體的獎勵反饋函式,而不是像監督學習直接告訴智慧體最終的答案。

然後我們給大家說一下無監督學習與強化學習的區別,在強化學習中,有一個從輸入到輸出的對映過程,但是這個過程在無監督學習中是不存在的。在無監督學習中,主要任務是找到一個最基礎的模式,而不是一種對映關係。無監督學習就是根據自己獲得的資料去構建一個“知識圖譜”,從而去找出相似內容的資料。具體應用就是新聞頭條的適配。

其實還有第四種型別的機器學習,成為半監督學習,其本質上是監督學習和無監督學習的組合。它不同於強化學習,類似於監督學習和半監督學習具有直接的參照答案,而強化學習不具有。

關於強化學習與其他機器學習演算法的不同我們就給大家介紹到這裡了,相信大家對強化學習的知識有了更深的瞭解了吧?希望這篇文章能夠更好的幫助大家理解強化學習。

相關文章