強化學習第二版(翻譯)第一章 導論(前言)Chapter 1 Introduction

ThousandsOfWind發表於2018-03-26

    當我們思考學習的本質時,我們首先想到的是通過與環境互動來學習。當嬰兒玩耍時,揮舞手臂或四處看,它沒有明確的老師,但他可以通過直接的感覺與環境聯絡。他可以通過這種聯絡獲得大量關於因果關係,行動的結果,以及如何實現目標的資訊。在我們的生活中,這樣的交流無疑是我們的環境和我們自己知識的主要來源。無論我們是學開車還是交談,我們都可以敏銳的意識到我們的環境對我們所做的事情將作出什麼樣的反應,並且我們試圖通過我們的行為來影響所發生的事情。從互動中學習是幾乎所有學習和智慧理論的基本思想。

    在這本書中,我們探索了一種從互動中學習的計算方法。我們不直接對人或動物如何學習進行理論分析,而是探索理想化的學習情境,評估各種學習方法的效率。也就是說,我們採用人工智慧研究人員或工程師的角度。我們探索去設計在這些方面上格外有效率的機器,他能夠解決科學或經濟學領域的問題。通過資料分析和計算實驗來評估這些設計(solving learning problems of scientific or economic interest, evaluating the designs through mathematical analysis or computational experiments)。我們將這種方法稱為強化學習,更側重於目標導向的互動學習,而不是其他方法。

相關文章