實驗介紹:
一:多分類問題
我們想要機器自動識別不同種類的生物,這就涉及到多分類問題。
支援向量機的介紹
講得很好引用一下
支援向量機SVM詳解
支援向量機和邏輯迴歸的區別是:邏輯迴歸是找一條曲線把資料分開,支援向量機就是找一個寬馬路把不同類資料隔得越遠越好
支援向量機對異常資料的容忍就會好一些
搭建流程
輸入資料[資料連結]
(https://files.cnblogs.com/files/blogs/815873/datasets.zip?t=1730452340&download=true "資料連結")
資料是不同種類動物的腿,尾巴等的資料特徵
將交叉驗證改成10次,可以看見擬合非常好
使用邏輯迴歸演算法進行對比
邏輯迴歸擬合更好
二:決策樹
新建一個決策樹的工作流,輸入泰坦尼克號的生存資料,分析不同情況下的生存機率
檢視樹部件如其名,用來檢視決策樹。
決策樹 葉子節點代表不同的分類,按決策規則分支。
三:整合學習
袋裝
自助抽樣:隨機有放回地抽樣。
自助抽樣舉例:十個紅球裡面放一個黑球,不管抽多少次抽到黑球機率都是1/11。
引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07
因為是投票決定,需要模型為奇數個,否則會出現兩個模型平票。
隨機森林
引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07
因為是投票決定,需要模型為奇數個。
堆疊
引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07
提升
引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07
工作流如下
畢達哥拉斯森林用來檢視隨機森林
我使用的是泰坦尼克號生存的資料