強化學習第二版(翻譯)第一章 導論(前言)Chapter 1 Introduction
當我們思考學習的本質時,我們首先想到的是通過與環境互動來學習。當嬰兒玩耍時,揮舞手臂或四處看,它沒有明確的老師,但他可以通過直接的感覺與環境聯絡。他可以通過這種聯絡獲得大量關於因果關係,行動的結果,以及如何實現目標的資訊。在我們的生活中,這樣的交流無疑是我們的環境和我們自己知識的主要來源。無論我們是學開車還是交談,我們都可以敏銳的意識到我們的環境對我們所做的事情將作出什麼樣的反應,並且我們試圖通過我們的行為來影響所發生的事情。從互動中學習是幾乎所有學習和智慧理論的基本思想。
在這本書中,我們探索了一種從互動中學習的計算方法。我們不直接對人或動物如何學習進行理論分析,而是探索理想化的學習情境,評估各種學習方法的效率。也就是說,我們採用人工智慧研究人員或工程師的角度。我們探索去設計在這些方面上格外有效率的機器,他能夠解決科學或經濟學領域的問題。通過資料分析和計算實驗來評估這些設計(solving learning problems of scientific or economic interest, evaluating the designs through mathematical analysis or computational experiments)。我們將這種方法稱為強化學習,更側重於目標導向的互動學習,而不是其他方法。
相關文章
- Chapter 1:IntroductionAPT
- javascript忍者祕籍(第二版)翻譯學習 第一章 JavaScript無處不在JavaScript
- 【深度學習 論文篇 01-1 】AlexNet論文翻譯深度學習
- RSA Lib Chapter 1 -- Introduction (RSA實驗室 第一章,密碼學介紹)APT密碼學
- 強化學習理論-第1課-基礎概念強化學習
- Samza文件翻譯 : Comparison Introduction
- unp學習筆記——Chapter1筆記APT
- [Java] Introduction to Java Programming 筆記: Chapter 1. 概念Java筆記APT
- 強化學習系列(1):簡介強化學習
- 深度學習論文翻譯解析(十二):Fast R-CNN深度學習ASTCNN
- 【強化學習】強化學習/增強學習/再勵學習介紹強化學習
- 強化學習-學習筆記1 | 基礎概念強化學習筆記
- 【譯】WebSocket協議第一章——介紹(Introduction)Web協議
- 深度學習論文翻譯解析(十六):Squeeze-and-Excitation Networks深度學習
- 張正友標定論文翻譯(1)
- 翻譯經典之《Cisco Lan Switching》:前言
- The Pragmatic Programmer 翻譯(前言章節部分) (轉)
- 12. 2020年秋季UC Berkeley CS285《深度強化學習》第4課:強化學習導論_2/6【中英字幕】強化學習
- 【譯文】偽標籤學習導論 - 一種半監督學習方法
- 神經網路和深度學習(1):前言神經網路深度學習
- 強化學習強化學習
- 深度學習論文翻譯解析(十九):Searching for MobileNetV3深度學習
- 強化學習-學習筆記13 | 多智慧體強化學習強化學習筆記智慧體
- TransH論文翻譯
- NDT論文翻譯
- 深度強化學習day01初探強化學習強化學習
- 【強化學習】強化學習術語表(A-Z)強化學習
- 【強化學習篇】--強化學習案例詳解一強化學習
- 用強化學習做神經機器翻譯:中山大學&MSRA填補多項空白強化學習
- 吐槽下《MongoDB 實戰》(第二版)的翻譯MongoDB
- Flutter 學習 01 - 前言Flutter
- 深度學習0:前言深度學習
- 演算法導論第二章練習演算法
- 強化學習-學習筆記7 | Sarsa演算法原理與推導強化學習筆記演算法
- 《Pattern Recognition and Machine Learning》第一章1. INTRODUCTIONMac
- 強化學習10——迭代學習強化學習
- 谷歌論文:使用深度強化學習的晶片佈局谷歌強化學習晶片
- 【強化學習】不用地圖如何導航?DeepMind提出新型雙路徑強化學習「智慧體」架構強化學習地圖智慧體架構