前言
AI實時聲音轉換的教程,僅供交流學習,請勿用作非法用途
VCClient的影片教程,但是下載連結建議從官方渠道(見下)https://www.bilibili.com/video/BV1kF2qYhEx3
VCClient的專案主頁https://github.com/w-okada/voice-changer, 下載地址https://huggingface.co/wok000/vcclient000/tree/main
虛擬音效卡voicemeter教程https://www.bilibili.com/video/BV1Bs421K7uB
虛擬音效卡voicemeter下載連結https://www.123pan.com/s/rlSxjv-KXXp3.html提取碼:6666
教程
先從https://huggingface.co/wok000/vcclient000/tree/main下載對應平臺的版本,電腦是nvidia顯示卡的可以下載cuda版本,解壓
從前言連結下載voicemeter並按其中教程安裝
VCClient配置
點選VCClient資料夾中的main中的start_https.bat啟動VCClient,從上方選擇一個角色模型,配置如下
其中Gain指的是輸入和輸出的音量,mon是監控流(monitor,可以理解為監聽耳機)的音量,
最關鍵的是Pitch是音調,不換聲音性別的話保持0即可,如果是男變女聲,可以調高,建議8~15,如果是女變男聲,建議調低到-8~-15
Noise是去噪的一些功能,可以根據視聽效果選擇(基本感覺不出來差別)
F0 Est是選擇演算法模型,建議rmvpe或者rmvpe_onnx,下面一個應該是相關引數,建議不動
Chunk是間隔多久取樣一個片段作為基本單元(單詞、字句)進行轉換,Extra是取樣大小
GPU如果你有Nvidia顯示卡,下載了cuda版本,建議選一下對應的顯示卡
Audio部分選Client(本地)
in和out選擇你的麥克風和耳機,mon選擇你自己的耳機,這時候你可以點選右上角的start說話試試了,不用的時候記得stop。
passthru是聲音直通不做處理
貼一個翻譯
由於我們面向的場景是直播串流,你的變聲輸出需要給直播軟體作為輸入,但是直播軟體無法直接把vcclient視作一個音源,所以我們需要把vcclient的output設定成虛擬音效卡的輸入,也就是
VoiceMeeter Aux Input,然後直播軟體選擇麥克風時選擇VoiceMeeter Aux Output,這樣就透過VoiceMeeter這個I/O介面完成了輸入到直播軟體的操作。
VoiceMeeter設定
在應用列表找到VoiceMeeter Potato (64位作業系統使用者可以選擇x64版本)
先在右上角點選A1選擇輸入的麥克風為MME的耳機
然後由於你在VCClient中設定了把轉換的聲音輸出到VoiceMeeter Aux Input,此時可以看到VoiceMeeter Aux皮膚下面有個voice-changer的app圖示,說明正在使用此通道
再下方的0dB的滑條是控制輸出的音量,A1點開後可以讓自己聽到輸出,B1點開後可以讓VoiceMeeter Aux Output埠聽到輸出
所以我們一般先開啟A1B1試音,如果你在VCClient中點選了Start,此時說話就可以聽到變聲效果,然後我們把VCClient中的mon處裝置設定為none,並且在VoiceMeeter Aux介面關掉A1,你再說話會發現VoiceMeeter Aux下方的voice-changer有音量條跳動,但是自己聽不到變聲效果了,這就是我們想要的效果。
此時你只需要在直播軟體中設定麥克風輸入為VoiceMeeter Aux Output,即可讓觀眾在直播中聽到變聲後的效果。