分類模型應用案例(Classification Cases)
- 信用評分(Credit Scoring)
- 輸入:收入、儲蓄、職業、年齡、信用歷史等等
- 輸出:是否貸款
- 醫療診斷(Medical Diagnosis)
- 輸入:現在症狀、年齡、性別、病史
- 輸出:哪種疾病
- 手寫文字識別(Handwritten Character Recognition)
- 輸入:文字圖片
- 輸出:是哪一個漢字
- 人臉識別(Face Recognition)
- 輸入:面部圖片
- 輸出:是哪個人
把分類當成迴歸去做?
不行。
-
假設有兩個類別,其中類別1的標籤為1,類別2的標籤為-1,那0就是分界線,大於0就是類別1,小於0就是類別2。
迴歸模型會懲罰那些太正確的樣本。如果結果遠遠大於1,它的分類應該是類別1還是類別2?這時為了降低整體誤差,需要調整已經找到的迴歸函式,就會導致結果的不準確。
-
假設有多個類別,類別1的標籤是1,類別2的標籤是2,類別3的標籤是3。
這樣的話,標籤間具有2和3相近、3大於2這種本來不存在的數字關係。
理想替代方案(Ideal Alternatives)
-
模型
模型可以根據特徵判斷型別,輸入是特徵,輸出是類別
-
損失函式
預測錯誤的次數,即\(L(f)=\sum_n\delta(f(x^n)\neq\hat y^n)\)。
這個函式不可微
-
如何找到最好的函式
比如感知機(Perceptron)、支援向量機(SVM)
Github(github.com):@chouxianyu
Github Pages(github.io):@臭鹹魚
知乎(zhihu.com):@臭鹹魚
部落格園(cnblogs.com):@臭鹹魚
B站(bilibili.com):@絕版臭鹹魚
微信公眾號:@臭鹹魚的快樂生活
轉載請註明出處,歡迎討論和交流!