orange人工智慧迴歸問題

纤秾發表於2024-10-31

實驗介紹:

橙現智慧是一款視覺化,無程式設計,無門檻的免費人工智慧軟體。
機器也可以學習,機器學習可以簡單理解成總結經驗,發現規律,掌握規則,預測未來。
image

[此處插入圖片],該圖片作者為未知,來源於百度,僅學習非商用。

一:軟體的安裝

中文版本下載地址

https://pan.baidu.com/s/1TaYQd5rAzbemBW0EFbNNZA?pwd=8ekr
提取碼:8ekr,裡面自帶一些資料
概念先按下不表,我們直接從實操開始

二:迴歸問題

最近房價跌得很快,我們要怎麼預測未來的房價呢?

給出歷史資料,預測一個數值需要線性迴歸演算法

why?
迴歸的意思是迴歸到平均值,舉例:一個家族平均身高都是1.7m,即使有個人身高2.1m,一般來說他的子女也很難那麼高。我們需要找一個模型,使它預測的值“迴歸”真實值。
線性的意思就是可以簡單理解為直線。

資料+演算法生成模型

image
未匯入資料檔案,檔案上出現x
資料連結
image

資料處理

與結果密切相關的資料角色為“特徵”,我們要預測的資料角色為“目標”,與結果無關的資料角色為“忽略”
如果我們要預測明天食堂的消費額:index(序號)與食堂消費額無關,所以角色為“忽略”;消費額是我們要預測的,所以角色為“目標”。

image

點選右邊半弧拖出一條線,用中文或英語搜尋部件

左邊半弧是輸入,右邊半弧是輸出。
image
資料表能讓我們直觀看見資料
image
為什麼這個顯示沒有資料呢?
image

因為我們沒有把檔案資料輸入演算法

image

點開散點圖可以看見,線性迴歸演算法擬合的一個方程和值的對比。image

為什麼方程在值的點中間呢,前面我們說了迴歸方程是要回歸到平均值的。越多點越接近直線,點越均勻分佈在直線兩側,則方程擬合越好。

我們新增預測小部件利用資料和演算法對未來的情況進行預測和分析

image
R²是1-點距離方程的距離的平方和,越接近一,代表擬合越好。
image
已經看見線性迴歸預測消費額和食堂實際消費額,但還不夠視覺化。怎麼辦呢?
新增折線圖檢視線性迴歸預測消費額和食堂實際消費額對比
製作折線圖時,通常是需要先選擇合適的列資料,所以我們需要選擇列部件。
image
把線性迴歸和消費額作為目標
image
點開折線圖可以看見
選擇消費額按住ctrl再選線性迴歸,可以使兩個折線在一張圖上。
image

三:分類問題

我們怎麼訓練人工智慧自動區分貓狗呢?

分類問題需要使用邏輯迴歸演算法。

為什麼不是線性迴歸演算法呢?
因為線性迴歸演算法是取平均值;假設我們有寵物的體重資料作為特徵來判斷是貓是狗,有些品種的貓如緬因貓體型龐大容易誤判狗,有的狗體型小如吉娃娃容易誤判貓還會大幅度拉低平均值,使線性方程偏離。
image
引用圖片:已授權引用,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07

如果線性迴歸方程是一條直線,邏輯迴歸方程則是一條曲線。

我們在檔案匯入三種鳶尾花的資料,訓練人工智慧區分不同種類的鳶尾花。
image

使用分佈小部件 柱狀圖檢視不同種類鳶尾花的資料分佈

image
可以看見不同種類的鳶尾花花瓣長度差異很大
image
花萼寬度差異不大
image

混淆矩陣用於總結分類模型預測結果

image
紫色代表預測和實際相同的數量。紅色代表預測和實際不相同的數量。
預測正確的數量是,13+13+12=38。
image

在測試和評分小部件檢視CA,AUC

image
ROC分析也是越接近一越好
image

相關文章