深度學習具備強感知能力但缺乏一定的決策能力,強化學習具備決策能力但對感知問題束手無策,因此將兩者結合起來可以達到優勢互補的效果,為複雜系統的感知決策問題提供瞭解決思路。
今天我們推薦這樣一門課程——UC Berkeley的 CS188《人工智慧導論》(Introduction to Artificial Intelligence)。課程主要介紹了AI的基礎知識,尤其是強化學習方面,講解非常詳細,覆蓋面比較全面,學習資料也很豐富,包括了課程的全套視訊、課件PPT、課後學習資料、Homework、配套的Project,該視訊全部內容已經由 矩池雲 進行翻譯,對AI新手來說非常友好。
課程全套視訊
課程介紹
根據官方介紹,"該課程介紹了智慧計算機系統設計的基本思想和技術,具體側重於統計和決策理論建模方法的相關內容。"
話題涉及搜尋,博弈樹(Game Trees),馬爾可夫決策過程(MDP),強化學習,決策理論,概率問題、獨立性和推理等人工智慧科學基礎知識。
- 不知情搜尋:深度優先搜尋、寬度優先搜尋、統一成本搜尋
- 知情搜尋:貪婪搜尋、A*搜尋、啟發式+最優搜尋
- 對抗搜尋:極大極小值搜尋、α-β剪枝、Expectimax
- 決策理論:最大期望效益
- 馬爾可夫決策過程:貝爾曼方程、值迭代
- 強化學習:Q-learning、利用與探索策略
- 貝葉斯網路:獨立性、推理、取樣
- 機器學習:感知機、樸素貝葉斯網路、神經網路、叢集
學習完該課程後,你會 學會自己構建自動的agent,它可以在完全知情/部分可觀察/對抗環境中有效做出決策。你的AI agent會在不確定的環境中進行推理,根據獎勵結構自行優化行為。你會學會設計機器學習演算法,用於識別手寫數字以及進行影像分類。在本課程中學習的技術及方法適用於各類人工智慧問題,可以為你日後進一步研究深造的方向奠定一定的基礎。
課件插圖大多為卡通形式,你會經常看到課件上在玩《吃豆人》遊戲或者其他遊戲獲得的收益最大。隨著課程的深入,難度也會加大。對於基於python的程式設計練習,主要是用《吃豆人》遊戲作為教學輔助,課程實操部分構建了一個吃豆人遊戲框架,讓學生實施可插拔的搜尋策略。雖然部分學生反饋課程有一定難度,但這門課程仍被廣泛認為是目前提供AI相關技術基礎較為值得觀看的MOOC課程之一。
課程主講老師
該課程早期由Pieter Abbeel和Dan Klein講授。
Pieter Abbeel師從機器學習大牛吳恩達,是機器人學專家、UC伯克利電腦科學與電氣工程教授。他的深度強化學習和深度無監督學習教材是AI研究者的經典學習資料,包括CS294-158(Deep Unsupervised Learning)、CS188(Introduction to Artificial Intelligence)、CS287(Advanced Robotics)等。
Dan Klein,伯克利大學自然語言處理小組負責人。2004 年在史丹佛大學取得電腦科學的博士學位。主要研究重點是自然語言資訊的自組織,興趣領域包括無監督的語言學習、機器翻譯、NLP 的高效演算法、資訊提取、語言豐富的語言模型、NLP 的符號和統計方法的整合以及歷史語言學等。
基於兩位教授多年的教學實踐和課件資料,2020年的cs188夏季課程由Dan Klein教授的博士生Nikita Kitaev教授。最近,Nikita Kitaev的增量句法表示研究(Learned Incremental Representations for Parsing)獲得了ACL2022的最佳論文(Best Paper)。