過擬合與欠擬合-股票投資中的機器學習

寬邦科技發表於2019-01-30

本文來自Euclidean Technologies於2018年發表的一封公開信,主要介紹了機器學習在金融領域中的應用和前景。可供對機器學習感興趣的朋友學習,對量化投資人工智慧的結合有個初步的瞭解及認識。

過擬合與欠擬合-股票投資中的機器學習

截至今年9月,在標準普爾500指數成份股包括股息在內的總回報率為10.6%的情況下,Euclidean Fund I費用和支出淨額年漲幅為9.8%。這些回報來自於一個對價值投資者不利的環境。今年前9個月,昂貴成長型股票的總體主導地位繼續保持,而且,無利可圖的公司表現優於市場。

為了對我們的結果有所瞭解並明確我們的定位,我們來考慮Euclidean的投資組合中的這兩種觀點。它們不僅表明了我們為什麼對歐幾里得帶來未來回報的潛力持樂觀態度,也表明了為什麼市場對高成本、無利潤公司的青睞會對我們的戰略產生不利。我們相信,當盈利公司受到青睞、估值倍數受到壓縮時,我們的投資風格將會與眾不同——並且,這種情形最終很可能會出現。

與此同時,我們會一直透過結合我們的經驗、邏輯機器學習的使用,繼續完善我們的投資方式。我們的目標是完善歐幾里得(Euclidean)評估某個公司的財務狀況如何演變的流程,從而確定哪些公司是被投資者(以及當前市場價值)嚴重低估了的。

關於這些嘗試,我們認為現在正是將我們對發展投資模型的觀點分享出來的時候,比如模型過擬合和金融市場的非平穩性質。當你在研究定量投資方法時,這些主題極為重要。希望這封信能讓你們對Euclidean對這些主題的觀點有所瞭解。

機器學習和股票投資

金融市場存在著大量的隨機性、噪聲和模糊性,這是因為人類在制定市場價格的過程中,帶著情感和奇想,並在無意中被捲入其中。這導致一些人得出這樣的結論:複雜的機器學習模型,如神經網路和決策樹的集合,註定會被所有的噪音所誤導。令人擔心的結果是,這些模型可能會與資料過度匹配,發現本不存在的關係,而不是持久穩固的原則。

這種觀點源於另一種現象,那就是在深度(機器)學習領域中,一些最大的成就與遊戲有關,例如電子遊戲、國際象棋和圍棋。儘管這些遊戲很複雜,但它們與金融市場不同——它們有明確的規則。

在很多方面,我們認為這種對機器學習的擔憂是錯誤的。畢竟,機器學習已經被證實即使在非常嘈雜的領域也是成功的,比如語音識別計算機視覺。此外,正如我們在這封信中所描述的,機器學習提供了一個工具庫,專門設計用來在嘈雜的資料中梳理出訊號,並防止過擬合

但在我們開始討論之前,有必要說明一下,在Euclidean對機器學習在長期投資中的應用進行了長達10年的研究之後,我們已經得到的一些結論。在我們的研究中,我們就上述觀點進行了三次高水平的觀察:

相關文章