機器學習7-模型儲存&無監督學習

清風紫雪發表於2021-01-22

原文網址 : https://www.cnblogs.com/xiaofengzai/p/14315349.html

機器學習模型

模型儲存和載入

sklearn模型的儲存和載入API

from sklearn.externals import joblib
- 儲存：joblib.dump(rf, 'test.pkl')
- 載入：estimator = joblib.load('test.pkl')

線性迴歸的模型儲存載入案例

def linear3():
    """
    嶺迴歸的優化方法對波士頓房價預測
    """
    #獲取資料
    boston=load_boston()
    #劃分資料集
    x_train,x_test,y_train,y_test=train_test_split(boston.data,boston.target,random_state=22)
    #標準化
    transfer=StandardScaler()
    x_train=transfer.fit_transform(x_train)
    x_test=transfer.transform(x_test)
    #預估器
    # estimator=Ridge(alpha=0.0001, max_iter=100000)
    # estimator.fit(x_train,y_train)

    #儲存模型
    # joblib.dump(estimator,"my_ridge.pkl")

    #載入模型
    estimator=joblib.load("my_ridge.pkl")

    #得出模型
    print("嶺迴歸-權重係數為：\n",estimator.coef_)
    print("嶺迴歸-偏置為：\n",estimator.intercept_ )

    #模型評估
    y_predict = estimator.predict(x_test)
    print("預測房價：\n", y_predict)
    error = mean_squared_error(y_test, y_predict)
    print("嶺迴歸-均方差誤差:\n", error)
    return None


if __name__ == '__main__':
    # linear1()
    # linear2()
    linear3()

儲存：儲存訓練完結束的模型

載入：載入已有的模型，去進行預測結果和之前的模型一樣

無監督學習-K-means演算法

K-means原理

我們先來看一下一個K-means的聚類效果圖

K-means聚類步驟

隨機設定K個特徵空間內的點作為初始的聚類中心
2、對於其他每個點計算到K箇中心的距離，未知的點選擇最近的一個聚類中心點作為標記類別
3、接著對著標記的聚類中心之後，重新計算出每個聚類的新中心點（平均值）
4、如果計算得出的新中心點與原中心點一樣，那麼結束，否則重新進行第二步過程

我們以一張圖來解釋效果

K-meansAPI

sklearn.cluster.KMeans(n_clusters=8,init=‘k-means++’)
- k-means聚類
- n_clusters:開始的聚類中心數量
- init:初始化方法，預設為'k-means ++’
- labels_:預設標記的型別，可以和真實值比較（不是值比較）

案例：k-means對Instacart Market使用者聚類

如何評估聚類的效果？

Kmeans效能評估指標

輪廓係數

輪廓係數值分析

分析過程（我們以一個藍1點為例）

1、計算出藍1離本身族群所有點的距離的平均值a_i
2、藍1到其它兩個族群的距離計算出平均值紅平均，綠平均，取最小的那個距離作為b_i
根據公式：極端值考慮：如果b_i >>a_i: 那麼公式結果趨近於1；如果a_i>>>b_i: 那麼公式結果趨近於-1

結論

如果b_i>>a_i:趨近於1效果越好， b_i<<a_i:趨近於-1，效果不好。輪廓係數的值是介於 [-1,1] ，越趨近於1代表內聚度和分離度都相對較優。

輪廓係數API

sklearn.metrics.silhouette_score(X, labels)
- 計算所有樣本的平均輪廓係數
- X：特徵值
- labels：被聚類標記的目標值

案例-聚類評估

K-means總結

特點分析：採用迭代式演算法，直觀易懂並且非常實用
缺點：容易收斂到區域性最優解(多次聚類)

迴歸與聚類整體演算法總結

相關文章

機器學習——監督學習&無監督學習
2019-07-24
機器學習
機器學習：監督學習
2022-12-04
機器學習
【機器學習基礎】無監督學習（1）——PCA
2022-01-22
機器學習PCA
【機器學習基礎】無監督學習（3）——AutoEncoder
2022-05-07
機器學習
一圖看懂監督學習、無監督學習和半監督學習
2020-02-18
吳恩達機器學習筆記 —— 14 無監督學習
2018-07-25
吳恩達機器學習筆記
機器學習個人筆記（三）之無監督學習
2020-10-27
機器學習筆記
人工智慧 (05) 機器學習 - 無監督式學習群集方法
2019-12-19
人工智慧機器學習
【ML吳恩達】3 有監督學習和無監督學習
2020-11-19
吳恩達
機器學習--有監督學習--演算法整理
2024-06-07
機器學習演算法
【機器學習基礎】半監督學習簡介
2021-12-23
機器學習
【機器學習】李宏毅——自監督式學習
2022-12-19
機器學習
【機器學習基礎】無監督學習（2）——降維之LLE和TSNE
2022-03-21
機器學習
Python機器學習基礎篇三《無監督學習與預處理》
2020-12-26
Python機器學習
基於自編碼器的表徵學習：如何攻克半監督和無監督學習？
2018-12-22
監督學習or無監督學習？這個問題必須搞清楚
2020-05-02
監督學習
2024-06-05
無監督學習之降維
2019-08-30
機器學習-無監督學習(人臉識別，使用NMF進行特徵提取)
2018-05-08
機器學習特徵
【火爐煉AI】機器學習024-無監督學習模型的效能評估--輪廓係數
2018-09-05
AI機器學習模型
監督學習，無監督學習常用演算法集合總結，引用scikit-learn庫（監督篇）
2022-03-19
演算法
監督學習之支援向量機
2020-02-14
自監督學習
2024-04-15
人工智慧 (02) 機器學習 - 監督式學習分類方法
2019-12-18
人工智慧機器學習
人工智慧 (03) 機器學習 - 監督式學習迴歸方法
2019-12-18
人工智慧機器學習
在 Python 中儲存和載入機器學習模型
2021-09-26
Python機器學習模型
003.00 監督式學習
2019-09-17
自監督學習概述
2020-10-29
機器學習-訓練模型的儲存與恢復（sklearn）
2018-09-26
機器學習模型
機器學習之儲存與載入.pickle模型檔案
2020-11-08
機器學習模型
機器學習--有監督學習--分類演算法（預測分類）
2024-06-18
機器學習演算法
學習筆記14：模型儲存
2024-06-04
筆記模型
無監督學習才不是“不要你管”
2018-04-18
無監督學習-K-means演算法
2022-04-05
演算法
監督學習基礎概念
2020-02-14
監督學習之迴歸
2019-08-30
有監督學習——梯度下降
2023-03-11
梯度
機器學習模型
2024-03-30
機器學習模型