北京時間1月26日凌晨0點,首個機器學習-生命醫學大型資源庫TDC(Therapeutics Data Commons, https://tdcommons.ai/ https://github.com/mims-harvard/TDC)要舉辦首次使用者見面會了!
TDC一貫致力於透過推進資料共享,簡化模型評價,建立開源社群來推動機器學習和生命醫學領域的融合,讓更多的機器學習/生物醫藥研究者可以無門檻參與到實用且有價值的資料驅動模型開發中來, 進而推進生命醫學的進步。在釋出不到一年的時間內,TDC的資料集已經在在全球擁有三萬九千次下載,至今每個月保持超過三千次下載;包含資料處理,模型評價和性質預測函式的TDC軟體包至今已有超過三萬三千次下載。但顯然這還遠遠不夠,對於這偌大的領域,我們需要更多的學者參與,一起推動資料共享和社群建立,於是就有了本次使用者見面會。
在這次使用者見面會中,哈佛大學教授Marinka Zitnik會首先介紹TDC的初心及起源。然後史丹佛在讀博士生黃柯鑫將說明TDC的程式碼框架以及使用者如何參與到開源社群的建設中。佐治亞理工學院在讀博士生符天凡將介紹TDC目前定義的三類任務以及對應的資料集,如何用TDC結合DeepPurpose/scikit-learn完成機器學習任務、如何使用leaderboard提交結果。最後,麻省理工學院在讀博士生高文昊將簡單介紹如何透過TDC的介面使用docking(分子對接),以及基於分子對接的分子最佳化過程。
請對使用TDC有興趣的學者,對參與到TDC的建設感到興奮的同志,或者只是單純對機器學習/生物醫藥的讀者,點選下方連結註冊:
https://tinyurl.com/tdc-meeting
考慮到時間上不方便,在會議後我們會上傳會議的錄製影片。此外,之後我們也會以本公眾號為基礎,以圖文、影片等方式介紹TDC的相關內容和領域相關的文獻解讀。歡迎有興趣的小夥伴們關注!