吳恩達機器學習筆記（1-1到2-1）

吳恩達機器學習筆記（1-1到2-1）
https://www.bilibili.com/video/BV164411b7dx?p=1
https://www.bilibili.com/video/BV164411b7dx?p=2
https://www.bilibili.com/video/BV164411b7dx?p=3
https://www.bilibili.com/video/BV164411b7dx?p=4

機器學習-吳恩達

一、初學

1、什麼是機器學習

“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E.”

翻譯過來就是：一個電腦程式要完成任務（T），如果電腦獲取的關於T的經驗（E）越多，就表現（P）越好，那麼我們就可以說這個程式“學習”了關於T的經驗。簡單來說，機器學習是一個輸入的經驗（訓練資料）越多，表現就越好的電腦程式。

機器學習定義：在沒有明確設定情況下，使得機器能具有學習能力。

2、機器學習演算法分類

有監督學習：通俗來說就是人為輔助計算機進行學習
無監督學習：計算機自己學習

心得：機器學習正真的含義是讓機器學習知識並能夠使得計算機應用到對應使用領域。不必追求使用高大上的框架技術，而是應該掌握從零搭建機器學習的過程並掌握其細節與原理，為應對不同實際問題能夠隨心搭建解決問題的機器學習模型/框架。當然學習最新技術也是不可缺少的，學習其優點與思想，而不是去背繁瑣的“人造無用概念知識”。與此同時，也要掌握常見的AI工具進行輔助。

二、有監督學習

通俗來說，有監督學習就是，給機器（或程式）輸入一定量的資料集（這些資料都是真實情況採集到的，都是正確的資料），然後程式能夠對這些資料進行學習，然後推算出其他不存在於樣本中的資料（這些資料儘管不是真實的，但是卻可以對真實的預測）。其特徵是，人為的將正確的資料鑑別好，機器對從確鑑別好的資料進行學習，然後對未來或不存在的資料進行預測（預測結果符合資料集規律）。

這種有監督學習的常見演算法：

迴歸問題：對資料集進行迴歸方程擬合（即擬合符資料集規律的函式曲線），解出方程引數，最後使用方程對其他資料進行預測。通常用在資料集有類似於連續函式特性的情況。例如房價隨著佔地面積的變化，一般情況佔地面積和房價類似於一元一次函式或冪函式。
分類問題: 對資料集進行分類，將資料集按照某種依據進行分類，然後透過分佈或者分類曲線對其他資料進行機率推測。例如腫瘤預測。
- 說明：圖中y軸是年齡大小，x軸使腫瘤塊大小，資料集藍色環圈表示惡性腫瘤，紅色叉叉表示良性腫瘤。透過將資料集分類如上圖之後，當輸入引數年齡以及腫瘤塊大小，就能預測該腫瘤的良性與惡性機率。很明顯越靠近黑色分割線的右上方腫瘤為良性機率越大，越靠近右下方惡性機率越大。

三、無監督學習

無監督學習通俗來說相對於有監督學習，給定的資料集並沒有經過人為的鑑定，也沒有人為對程式進行強制篩選，而是透過無監督學習，機器能夠對這些看似無規律且分散的資料集進行聚類（自動把某些資料按照符合一定規律或者資料結構等特徵聚集在一類）。

例如在海量的新聞裡對新聞自動分類，哪些是經濟新聞，哪些是娛樂新聞等，並且這個分類並不是人為給出的，而是聚類分出的。再如從雜音裡剝離人聲，在雜音中將某個人的聲音聚類，從而得到該人的說話聲音資訊。