學習 《模型思維》-斯科特·佩奇 筆記 9.26

淡年華零發表於2020-09-26

分類模型

預測的實證研究結果與這種推論一致。雖然增加模型可以提高準確性(根據多樣性預測定理,必定會是這樣),但是在已經擁有了一定數量的模型之後再繼續增加模型,每個模型的邊際貢獻就會下降。例如,谷歌公司在實踐中發現,僅用一位面試官評估求職者(而不是隨機挑選),會使錄用一名高於平均水平僱員的概率從50%提高到74%,加入第二位面試官可以把這個概率提高到81%,再加入第三位面試官則只能把這個概率進一步提高到84%,加入第四位面試官也只能提高到86%……使用20位面試官也只能將這個概率提高到90%多一點。這些證據表明,增加面試官人數的作用是有限的。

宮:這回答了我昨天的疑問,模型並不是越多越好,擁有了一定數量的模型之後再增加模型,每個模型的邊際貢獻就會下降。

如果能構建出多個多樣性的、準確的模型,我們就可以做出準確的預測和估值,並選擇正確的行動。這些定理驗證了多模型思維邏輯的可靠性。但是,構建出滿足這些假設的許多模型,卻不是這些定理所能做到的,也不是它們所應該做到的。在實踐中,我們可能會發現我們可以構建出3個或5個很不錯的模型。如果是這樣,那就太好了。我們剛剛講過,加入1個模型後可以改進8%,加入3個模型後改進幅度可以達到15%。請不要忘記,第二個和第三個模型不一定比第一個模型更好,它們也許會更糟。但是,即使它們的準確性稍差,但只要分類(字面意義)有所不同,就應該把它們加入進來。

宮:我所理解的是隻要這些模型的側重點不一樣,那把他們加進來,也會增加模型整體的準確性。


適當的模型粒度

創造過多的類別會導致對資料的過度擬合,而過度擬合會破壞對未來事件的預測。


一對多

    學習模型需要時間精力以及廣泛的興趣和知識。為了減少學習成本,我們可以採用一對多方法。我們提倡掌握適量的、比較靈活的模型,並學會創造性地應用它們。例如,我們可以使用流行病學模型來解釋玉米良種的擴散、Facebook的風行、犯罪行為的傳播和流行明星的“吸粉”。我們將訊號傳遞模型應用於對廣告、婚姻、孔雀羽毛和保險費的分析。我們利用進化適應的崎嶇景觀模型解釋為什麼人類不需要鯨魚那樣的噴氣孔。當然,我們不能隨便拿起一個模型就將它應用到任何情境之中。但是,大多數模型都是靈活的。而且,即使失敗了我們也會有所獲益,因為嘗試創造性地使用模型能夠暴露它們的侷限,這是一件很有趣的事情。
    一對多方法是一個相對較新的方法。過去,特定的模型只屬於特定的學科。經濟學家有供求模型、壟斷競爭模型和經濟增長模型;政治學家有選舉競爭模型;生態學家有關於物種形成和複製的模型;物理學家有描述運動規律的模型,等等。所有這些模型都是針對特定目的而構建的。那個時候,科學家們不會將物理模型應用到經濟學領域,也不會用經濟學模型去研究大腦,就像普通人不會用縫紉機來修理洩漏的水管一樣。

相關文章