認知謬論:什麼是維度詛咒
你的資料越詳細,它就越缺乏洞察力。僅向圖形新增 1 個額外引數會導致圖形的體積呈指數增長,分散包含的資料點並刪除它們之間的有意義的關聯。
維度詛咒現象出現在數值分析、取樣、組合學、機器學習、資料探勘和資料庫等領域。這些問題的共同主題是,當維度增加時,體積空間的增長如此之快,以至於可用資料變得稀疏。為了獲得可靠的結果,所需的資料量通常會隨著維度呈指數增長。
這個短語,歸因於 Richard Bellman,是為了表達使用蠻力(又名網格搜尋)來最佳化具有太多輸入變數的函式的困難。
在今天的大資料世界裡,它也可以指當你的資料有大量維度時出現的其他幾個潛在問題。
- 如果我們的特徵比觀測值多,我們就會有大規模過度擬合模型的風險--這通常會導致糟糕的樣本外表現。
- 當我們有太多的特徵時,觀測值就會變得更難聚類--信不信由你,太多的維度會導致你的資料集中的每一個觀測值與其他的觀測值出現等距離。因為聚類使用了諸如歐幾里得距離這樣的距離測量方法來量化觀察結果之間的相似性,所以這是一個大問題。如果距離都是近似相等的,那麼所有的觀測值看起來都是一樣的(也是一樣的不同),就不能形成有意義的聚類。
可參考機器學習中 PCIA
相關文章
- 認知謬論:什麼是吉布森定律?
- 認知謬論:什麼是弗雷德金悖論
- 認知謬論:什麼是特威曼定律?
- 認知謬論:什麼是舍基原則?
- 認知謬論:維特根斯坦的尺子
- 什麼是認知謬誤中的“相對困境”?
- 生活的詛咒
- 這家公司的老大為啥總是詛咒V社將死?
- 認知謬論:為99%的程式設計師代言 - a16z程式設計師
- 【聊聊認知】你的答案是什麼
- 向死而生:《血源詛咒》的戰鬥系統解析
- 可重用性是一個謬論 - UWE FRIEDRICHSEN
- 【知識分享】什麼是IT運維管理服務運維
- 【IT運維小知識】安全組是什麼意思?運維
- 什麼是知識
- 《影子詭局:被詛咒的海盜》:如何鼓勵玩家勤用S/L大法?
- 什麼是Actor思維?
- 快速認識什麼是:DockerDocker
- 運維工程師是什麼?做什麼?運維工程師
- 什麼是工程師思維工程師
- 什麼是窮人思維?
- 什麼是Linux運維?Linux運維工程師需要做什麼?Linux運維工程師
- 《怪物男孩和被詛咒的王國》在遊戲設計上有何過人之處?遊戲設計
- Spring認證_什麼是Spring GraphQL?Spring
- Spring認證_什麼是Spring Security?Spring
- Spring認證_什麼是Spring GraphQLSpring
- 「Spring認證」什麼是Spring GraphQL?Spring
- 為什麼說TRIZ理論是基於本體論、認識論和自然辯證法產生的?
- 運維工程師核心工作是什麼?用什麼運維工具好?運維工程師
- 運維堡壘機是什麼?有什麼作用?運維
- 什麼百度霸屏?百度霸屏是什麼意思?
- 什麼是WHQL微軟徽標認證?為什麼需要這項認證?微軟
- 多因子認證是什麼意思?與雙因子認證有什麼區別?
- 什麼是IT運維管理服務運維
- 什麼是二階思維? - fs
- 什麼是輿情資訊?網路輿情\論是什麼意思?
- WHQL認證是什麼?如何實現
- 【IT運維小知識】虛擬化vCenter是什麼意思?有啥優勢?運維