隨機森林的祕密
http://blog.itpub.net/31509949/viewspace-2158398/
你瞭解隨機森林演算法嗎?你對隨機森林演算法瞭解到了怎樣的一個程度?如果你不甚瞭解或者某一地方存有疑惑,那麼這篇文章你一定不能錯過。
本文分為六個部分:
-
什麼是隨機森林演算法?
-
隨機森林演算法在生活中的具體應用
-
隨機森林演算法是如何工作的?
-
隨機森林演算法的科學性
-
隨機森林一些應用方面
-
隨森林演算法的一些利弊
什麼是隨機森林演算法?
隨機森林演算法是用於分類和迴歸問題的常用演算法。在機器學習中,隨機森林是一個包含多個決策樹的分類器, 並且其輸出的類別是由個別樹輸出的類別的眾數而決定的。
假設一個訓練集為[A,B,C,D],對應的標籤是[R1,R2,R3,R4]。
隨機森林建立三個決策樹的子集輸入,例如
樹1=[A,B,C]
樹2=[A,B,D]
樹3=[B,C,D]
最後,基於每個決策樹節點的多數票進行預測。
在隨機Forrest演算法中,為了建立多個決策樹,我們常使用的演算法有:資訊增益、熵和增益。
一些生活中的具體應用
假設我們想買一隻智慧手錶,我們會像身邊的朋友徵求意見。他會問你,你喜歡哪種手錶,並問你可以承受的價位。基於以上的問題,我們的朋友會做出恰當的推薦。而中間的這個過程就是對決策樹(隨機森林演算法)的一種具體的、生動的應用。
我們一般會想徵求更多朋友的意見,以便獲得更加全面的參考。
你應該知道以下要點:
在上面的例項中,朋友根據你的要求給出了他們的答案。你在眾多的答案中選擇了一個最符合你心意的,並買了那款智慧手錶。而這一系列的步驟,就是對隨機森林演算法的具體應用。
隨機森林演算法是如何工作的?
我們的模型中會有很多棵樹,每一棵樹都代表著不同的分裂。
隨機森林演算法有兩個階段,一個是隨機森林生成階段,另一個階段是從第一階段建立的隨機森林分類器中進行預測。
訓練步驟:
在決策樹中進行"多數票"表決。
偽碼:
每棵樹的生長規劃如下:
-
假設訓練集中的樣本數為N,我們現在從這N個樣本中進行隨機抽取。如果樣本是輸入變數,那麼替換後的樣本將作為樹生長的訓練集。
-
如果存在M個輸入變數或特徵,並指定一個數字m<M。我們需要在每個節點上隨機從M中選擇m個變數,m將作為M上的最佳分割節點。
-
每棵樹都儘可能地生長,沒有修剪。
通過對n棵樹的預測來得出新的預測資料。
Scikit隨機森林
第一部分:資料預處理
第二部分:隨機森林分類器模型的建立
第三部分:預測和精度結果
隨機森林的應用
銀行業:
隨機森林演算法在銀行方面的主要應用是用來創立使用者的誠信檔案。方便誠信使用者進行大金額貸款並對失信使用者做出一系列制裁。
醫學:
隨機森林演算法既可以識別藥物成分的正確組合,也可以通過分析病人的病歷來識別病人可能患哪種疾病。
股票市場:
隨機森林演算法可以用來預測股票的漲跌趨勢。
電子商務:
隨機森林演算法可以根據相似客戶的購買經歷預測某客戶是否喜歡該產品。
隨機森林演算法的利弊
優點:
-
隨機森林也可用於分類和迴歸問題。
-
處理缺失值並保持丟失資料的準確性。
缺點:
-
有利於分類,但不利於迴歸,因為不能預測超出範圍的資料。
-
你很難控制模型的損失。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2168607/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 隨機森林演算法隨機森林演算法
- R:microtable包隨機森林隨機森林
- 隨機森林、EM、HMM、LDA隨機森林HMMLDA
- 隨機森林和機器學習隨機森林機器學習
- 隨機森林演算法梳理隨機森林演算法
- 決策樹和隨機森林隨機森林
- 聊聊基於Alink庫的隨機森林模型隨機森林模型
- 6. 整合學習&隨機森林隨機森林
- 一句話總結隨機森林隨機森林
- Bagging(Bootstrap aggregating)、隨機森林(random forests)、AdaBoostboot隨機森林randomREST
- 隨機森林R語言預測工具隨機森林R語言
- 隨機森林演算法深入淺出隨機森林演算法
- 【機器學習】--決策樹和隨機森林機器學習隨機森林
- Java 隨機數探祕Java隨機
- 隨機森林n_estimators 學習曲線隨機森林
- 【機器學習】整合學習——Bagging與隨機森林機器學習隨機森林
- 【python3】基於隨機森林的氣溫預測Python隨機森林
- 隨機森林演算法原理與Python實現隨機森林演算法Python
- 隨機森林VS神經網路:哪個更好?隨機森林神經網路
- Linux 生成隨機密碼Linux隨機密碼
- JS生成隨機密碼JS隨機密碼
- 一文讀懂隨機森林的解釋和實現隨機森林
- RandomForest 隨機森林演算法與模型引數的調優randomREST隨機森林演算法模型
- Eventloop的祕密OOP
- Bagging與隨機森林(RF)演算法原理總結隨機森林演算法
- 【小白學AI】隨機森林 全解 (從bagging到variance)AI隨機森林
- 隨機森林RF模型超引數的最佳化:Python實現隨機森林模型Python
- 一份飛機餐的價格祕密
- 如何得到一個隨機密碼隨機密碼
- 讓遊戲更有趣的祕訣:策略與隨機遊戲隨機
- mysql 5.7 初始化密碼或隨機密碼MySql密碼隨機
- 基於隨機森林演算法進行硬碟故障預測隨機森林演算法硬碟
- 一個PHP通用隨機密碼的實現PHP隨機密碼
- Python實現隨機森林RF並對比自變數的重要性Python隨機森林變數
- 揭祕Java高效隨機數生成器Java隨機
- 關於NSUserDefaults的祕密
- 網頁文字的祕密網頁
- 隱藏在水印的祕密