orange人工智慧分類問題

纤秾發表於2024-10-31

實驗介紹:

一:多分類問題

我們想要機器自動識別不同種類的生物,這就涉及到多分類問題。

支援向量機的介紹

講得很好引用一下
支援向量機SVM詳解
支援向量機和邏輯迴歸的區別是:邏輯迴歸是找一條曲線把資料分開,支援向量機就是找一個寬馬路把不同類資料隔得越遠越好
支援向量機對異常資料的容忍就會好一些
image

搭建流程
image
輸入資料[資料連結]
(https://files.cnblogs.com/files/blogs/815873/datasets.zip?t=1730452340&download=true "資料連結")
資料是不同種類動物的腿,尾巴等的資料特徵
image

將交叉驗證改成10次,可以看見擬合非常好
image
image

使用邏輯迴歸演算法進行對比

image
邏輯迴歸擬合更好
image

二:決策樹

新建一個決策樹的工作流,輸入泰坦尼克號的生存資料,分析不同情況下的生存機率
image
image
檢視樹部件如其名,用來檢視決策樹。

決策樹 葉子節點代表不同的分類,按決策規則分支。

image
image
image

三:整合學習

袋裝

自助抽樣:隨機有放回地抽樣。
自助抽樣舉例:十個紅球裡面放一個黑球,不管抽多少次抽到黑球機率都是1/11。
image

引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07

因為是投票決定,需要模型為奇數個,否則會出現兩個模型平票。

隨機森林

image

引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07

因為是投票決定,需要模型為奇數個。

堆疊

image

引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07

提升

image

引用圖片:已授權,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07

工作流如下
畢達哥拉斯森林用來檢視隨機森林
image
我使用的是泰坦尼克號生存的資料
image
image

相關文章