實驗介紹:
橙現智慧是一款視覺化,無程式設計,無門檻的免費人工智慧軟體。
機器也可以學習,機器學習可以簡單理解成總結經驗,發現規律,掌握規則,預測未來。
[此處插入圖片],該圖片作者為未知,來源於百度,僅學習非商用。
一:軟體的安裝
中文版本下載地址
https://pan.baidu.com/s/1TaYQd5rAzbemBW0EFbNNZA?pwd=8ekr
提取碼:8ekr,裡面自帶一些資料
概念先按下不表,我們直接從實操開始
二:迴歸問題
最近房價跌得很快,我們要怎麼預測未來的房價呢?
給出歷史資料,預測一個數值需要線性迴歸演算法
why?
迴歸的意思是迴歸到平均值,舉例:一個家族平均身高都是1.7m,即使有個人身高2.1m,一般來說他的子女也很難那麼高。我們需要找一個模型,使它預測的值“迴歸”真實值。
線性的意思就是可以簡單理解為直線。
資料+演算法生成模型
未匯入資料檔案,檔案上出現x
資料連結
資料處理
與結果密切相關的資料角色為“特徵”,我們要預測的資料角色為“目標”,與結果無關的資料角色為“忽略”
如果我們要預測明天食堂的消費額:index(序號)與食堂消費額無關,所以角色為“忽略”;消費額是我們要預測的,所以角色為“目標”。
點選右邊半弧拖出一條線,用中文或英語搜尋部件
左邊半弧是輸入,右邊半弧是輸出。
資料表能讓我們直觀看見資料
為什麼這個顯示沒有資料呢?
因為我們沒有把檔案資料輸入演算法
點開散點圖可以看見,線性迴歸演算法擬合的一個方程和值的對比。
為什麼方程在值的點中間呢,前面我們說了迴歸方程是要回歸到平均值的。越多點越接近直線,點越均勻分佈在直線兩側,則方程擬合越好。
我們新增預測小部件利用資料和演算法對未來的情況進行預測和分析
R²是1-點距離方程的距離的平方和,越接近一,代表擬合越好。
已經看見線性迴歸預測消費額和食堂實際消費額,但還不夠視覺化。怎麼辦呢?
新增折線圖檢視線性迴歸預測消費額和食堂實際消費額對比
製作折線圖時,通常是需要先選擇合適的列資料,所以我們需要選擇列部件。
把線性迴歸和消費額作為目標
點開折線圖可以看見
選擇消費額按住ctrl再選線性迴歸,可以使兩個折線在一張圖上。
三:分類問題
我們怎麼訓練人工智慧自動區分貓狗呢?
分類問題需要使用邏輯迴歸演算法。
為什麼不是線性迴歸演算法呢?
因為線性迴歸演算法是取平均值;假設我們有寵物的體重資料作為特徵來判斷是貓是狗,有些品種的貓如緬因貓體型龐大容易誤判狗,有的狗體型小如吉娃娃容易誤判貓還會大幅度拉低平均值,使線性方程偏離。
引用圖片:已授權引用,來源《人工智慧基礎》耿煜 電子工業出版社 2022-07
如果線性迴歸方程是一條直線,邏輯迴歸方程則是一條曲線。
我們在檔案匯入三種鳶尾花的資料,訓練人工智慧區分不同種類的鳶尾花。
使用分佈小部件 柱狀圖檢視不同種類鳶尾花的資料分佈
可以看見不同種類的鳶尾花花瓣長度差異很大
花萼寬度差異不大
混淆矩陣用於總結分類模型預測結果
紫色代表預測和實際相同的數量。紅色代表預測和實際不相同的數量。
預測正確的數量是,13+13+12=38。
在測試和評分小部件檢視CA,AUC
ROC分析也是越接近一越好