著力於解決歌唱聲音轉換問題。歌唱聲音轉換可以為每一個人搭建歌唱資料集,可以學習目標人音色,使用音訊相關深度演算法和模型框架,完成歌曲中的音色替換。要求能夠設計一個在不使用GPU的環境下執行, 在精細度、速度和模型大小上取得平衡的最佳化的演算法模型。
此外還要求實施者自行以收集開源資料或自主建立資料的方式收集資料、建立音訊多人聲分離演算法模型。並完成模型訓練、最佳化、工程化(python或C++皆可)等工作,最終產出一個可執行程式,針對5個目標音色進行歌唱聲音轉換。
將目標音色遷移到想唱的歌曲上,具體要求如下:輸入目標人聲,選定需要轉唱的歌曲,使用目標人音色替換原始人音色,並保證音訊的質量不會發生太大的降低,需要保證替換音色後的音訊在自然度和相似性上可以得到保證,最後將生成的歌曲和伴奏整合,輸出轉唱的歌曲。
囉囉嗦嗦一大堆,說白了就是向搭建一個類似虛擬歌姬的程式,只不過使用的不是捏造出來的聲音而是真人(或者更改過的真人聲線)
…這讓我莫名想起了東方梔子,而梔子早在11年就已經誕生了,她當時就是採用是UTAU(歌聲合成)和嫋嫋的音源
這和選題幾乎是…