Scikit-learn的六大功能!Python學習

老男孩IT教育機構發表於2021-04-08

  Scikit-learn是Python程式語言的免費軟體機器學習庫,基本功能主要被分為六大部分:分類、迴歸、聚類、資料降維、模型選擇和資料與處理。

  分類:指識別給指定物件的所屬類別,屬於監督學習的範疇,最常見的應用場景包含垃圾郵件檢測和影像識別等。目前Scikit-learn已經實現的演算法包括:支援向量機、邏輯迴歸、隨機森林、決策樹以及多層感知器神經網路等。

  迴歸:指預測與給定物件相關聯的連續值屬性,最常見的應用場景包含預測藥物反應和預測股票價格等。

  聚類:指自動識別具有相似屬性的給定物件,並將其分組為集合,屬於無監督學習的範疇,最常見的應用場景包括顧客細分和試驗結果分組。目前Scikit-learn已經實現的演算法包括:K-均值聚類、譜聚類、均值偏移、分層聚類、DBSCAN聚類等。

  資料降維:指使用主成分分析、非負矩陣分解或特徵選擇等降維技術來減少要考慮的隨機變數的個數,其主要應用場景包括視覺化處理和效率提升。

  模型選擇:指對於給定引數和模型的比較、驗證和選擇,其主要目的是透過引數排程來提升精度。目前Scikit-learn實現的模組包括:格點搜尋、交叉驗證和各種針對預測誤差評估的度量函式。

  資料預處理:指資料的特徵提取和歸一化,是機器學習過程中的第一個也是最重要的一個環節。這裡歸一化是指將輸入資料轉換為具有零均值和單位權方差的新變數。但因為大多數時候都做不到精確等於零,因此會設定一個可接受的範圍,一般都要求落在0-1之間。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2767142/,如需轉載,請註明出處,否則將追究法律責任。

相關文章