論文地址:https://arxiv.org/pdf/2007.10984.pdf
專案地址:http://foley-music.csail.mit.edu/
為了解決這個問題,由MIT-IBM 沃森人工智慧實驗室主任研究員淦創博士領導的研究小組提出了一種名為 “Foley Music” 的模型,可以從無聲影片中生成富有表現力的音樂。該模型將影片作為輸入,檢測影片中的人體骨架,識別其與樂器之間的互動作用,預測相應的 MIDI 檔案。論文已入選計算機視覺頂會 ECCV 2020。
論文地址:https://arxiv.org/pdf/2007.10984.pdf
專案地址:http://foley-music.csail.mit.edu/
為了解決這個問題,由MIT-IBM 沃森人工智慧實驗室主任研究員淦創博士領導的研究小組提出了一種名為 “Foley Music” 的模型,可以從無聲影片中生成富有表現力的音樂。該模型將影片作為輸入,檢測影片中的人體骨架,識別其與樂器之間的互動作用,預測相應的 MIDI 檔案。論文已入選計算機視覺頂會 ECCV 2020。