今日面試題分享:解決bias和Variance問題的方法是什麼?
長按識別上方二維碼,關注:七月線上實驗室,回覆關鍵詞:100
即可免費領取【100道機器學習面試題(上)】PDF版本一份
解決bias和Variance問題的方法是什麼?
參考答案:
解析:
High bias解決方案:Boosting、複雜模型(非線性模型、增加神經網路中的層)、更多特徵 High Variance解決方案:bagging、簡化模型、降維
具體而言
高偏差, 可以用boosting模型, 對預測殘差進行優化, 直接降低了偏差. 也可以用高模型容量的複雜模型(比如非線性模型, 深度神經網路), 更多的特徵, 來增加對樣本的擬合度.
高方差, 一般使用平均值法, 比如bagging, 或者模型簡化/降維方法, 來降低方差.
高偏差和高方差都是不好的, 我們應該加以避免. 但是它們又是此消彼長的關係, 所以必須權衡考慮. 一般情況下, 交叉驗證訓練可以取得比較好的平衡:
將原始樣本均分成K組, 將每組樣本分別做一次驗證集,其餘的K-1組子集資料作為訓練集,這樣會得到K個模型, 這K個模型可以併發訓練以加速. 用這K個模型最終的驗證集的分類準確率的平均數作為此K-CV下分類器的效能指標. K一般大於等於3, 而K-CV 的實驗共需要建立 k 個models,並計算 k 次 test sets 的平均預測正確率。
在實作上,k 要夠大才能使各回合中的 訓練樣本數夠多,一般而言 k=10 (作為一個經驗引數)算是相當足夠了。
題目來源:七月線上官網(www.julyedu.com)——面試題庫——面試大題——機器學習
今日學習推薦
【PyTorch的入門與實戰】
16小時帶你實戰PyTorch 1.0
四大課程特色 八大實戰專案
長按識別下方二維碼
免費試聽
?
長按識別二維碼
●一文詳解機器學習中最好用的提升方法:Boosting 與 AdaBoost
點
諮詢,檢視課程,請點選“閱讀原文”
「 在看的,麻煩點一下再走~ 」相關文章
- 今日面試題分享:什麼是最大熵面試題熵
- 演算法崗面試題:模型的bias和variance是什麼?用隨機森林舉例演算法面試題模型隨機森林
- 今日面試題分享:請問(決策樹、Random Forest、Booting、Adaboot)GBDT和XGBoost的區別是什麼?...面試題randomRESTboot
- 今日面試題分享面試題
- JSONP的原理是什麼?解決什麼問題?JSON
- 什麼是 Flink SQL 解決不了的問題?SQL
- 【Java面試】什麼是可重入,什麼是可重入鎖? 它用來解決什麼問題?Java面試
- 什麼是P問題、NP問題和NPC問題
- 今日面試題分享:為什麼xgboost要用泰勒展開,優勢在哪裡?面試題
- 六西格瑪解決問題的思路是什麼?
- 滲透測試可以解決哪些問題?服務方式是什麼?
- 【題解】程式設計作業ex5: Regularized Linear Regression and Bias/Variance (Machine Learning)程式設計ZedMac
- Service Mesh是什麼,為我們解決了什麼問題?
- [轉載]什麼是P問題、NP問題和NPC問題
- 介紹什麼是同源和什麼是跨域,以及三種解決跨域問題的路徑跨域
- RAG能解決大模型的什麼問題?不能解決什麼問題?大模型
- 遇到問題的解決方法
- Promise到底解決了什麼問題?Promise
- 關於input的一些問題解決方法分享
- 什麼是雲原生?為什麼是Portworx來解決雲原生儲存問題?
- 什麼是智慧礦山?它能解決什麼問題?
- MySQL是怎麼解決幻讀問題的?MySql
- SERVICE問題解決方法
- 多執行緒的出現是要解決什麼問題的? 本質什麼?執行緒
- 雲真機可以幫助測試解決什麼問題?
- GO Modules的理解和遇到的問題解決方法Go
- 分散式系統中常見技術解決的問題是什麼?分散式
- but no encoding declared;問題的解決方法Encoding
- 企業需要DFSS解決什麼問題?
- ES6解決了什麼問題
- 為什麼凸問題的解集是凸集
- 跨鏈橋的存在解決了什麼問題?
- 面試題1:9月25日面試題面試題
- 機器學習中偏差bias和方差variance區別機器學習
- 【Java面試】什麼是冪等?如何解決冪等性問題?Java面試
- 今日面試題分享:如何理解模型的過擬合與欠擬合,以及如何解決?面試題模型
- 解決問題通用方法論
- As常見問題解決方法