我的作業筆記：吳恩達的Python機器學習課程（神經網路篇）

本文將介紹吳恩達的機器學習課程中關於神經網路的程式設計作業3和4。這也是我們在課程中遇到的第一個複雜的非線性演算法。我不瞭解你，但這個任務對於我來說肯定有一個陡峭的學習曲線。神經網路構成了深度學習的基礎，它具有廣泛的應用，如計算機視覺或自然語言處理。因此，重要的是獲得基本權利並在python中編碼這些賦值是確保這一點的一種方法。

在進入神經網路之前，讓我們完成邏輯迴歸的最後一節 - 多類Logistic迴歸。

該系列練習利用由5000個訓練示例組成的手寫數字資料集，其中每個示例都是20×20畫素的數字灰度影像。

載入資料集

由於資料集是以.mat格式而不是通常的.txt格式給出的，因此我需要使用scipy loadmat函式。官方文件可以在這裡找到。（https://docs.scipy.org/doc/scipy-0.19.0/reference/generated/scipy.io.loadmat.html）由於loadmat將.mat檔案作為帶有變數名稱作為鍵的字典載入，因此分配X和y就像使用變數的鍵訪問dict一樣簡單。

為了更好地理解資料集，具有資料的形狀可以告訴我們資料的維度。 X形狀為5000,400，其對應5000個訓練示例，每個示例具有來自其20×20畫素的400個特徵。 y具有5000,1的形狀，其中每個訓練示例具有範圍從1到10的標籤（在該資料集中'0'數字被標記為'10'）。

視覺化資料

上面的程式碼塊構造了100個子圖，並使用plt.imshow隨機視覺化5000個訓練示例中的100個。請注意，我們必須將訓練示例重新塑造為20 X 20畫素，才能將其視覺化並將order =“F”作為引數新增到重塑功能中，以確保影像的方向是垂直的。

計算成本函式和梯度

這類似於我們在Logistic迴歸分配中使用的成本函式。

現在進行分類任務。由於我們有多個類，我們必須使用一對一分類方法（每個類一個分類器）訓練多個邏輯迴歸分類器。

gradientDescent函式是我們之前實現的常用優化函式。對於oneVsAll，它遍歷所有的類，並使用梯度下降(作業中使用了fmincg函式)為每個類訓練一組。然後all_theta捕獲列表中的所有優化的theta並返回為numpy陣列，重新塑造為theta的矩陣，其中第i行對應於標籤i的分類器。 np.where在這裡派上用場，為每個類得到一個y的向量，每個類的向量有1/0，以便在每次迭代中進行二進位制分類任務。

繪製成本函式以確保梯度下降按預期工作