主要參考文獻為:《機構投資者抱團與股價崩盤風險》(吳曉暉,郭曉冬,喬政)。這篇文獻發表在中國工業經濟雜誌上,但作者只提供了處理過的投資機構團體持股資料,具體處理的程式碼則並未展示。 這裡根據這篇文獻,依據如下步驟進行復原: 1、下載國泰安中機構團體持股比例資料,合併為一個檔案,約475萬條資料。 2、根據投資機構名稱,篩選機構名稱中含有“投資”“公司”字樣的機構。 3、使用python,篩選出每年,任意兩家投資機構持有某家公司股票大於5%的組合,輸出到csv檔案。 4、按年進行拆分,並加入權重列,儲存為txt檔案。 5、使用python,將資料根據louvain演算法,得出社群團體。 6、將多年的社群團體合併為一個檔案,一共兩列,一列為投資機構id,一列為年份。 7、根據第6步的資料,篩選第一步中475萬條資料中,某機構在某年,對某公司屬於任意一投資團體的資料。 8、根據年份、股票程式碼進行彙總,得出最終資料,2003年到2020年,一共27424條資料。
資料截圖:
獲取程式碼,聯絡微信:canglang12002