MoneyPrinterPlus可以使用大模型自動生成短影片,其中的語音合成和語音識別部分需要藉助於一些第三發雲廠商的語音服務。
很多小夥伴可能不知道應該如何配置,這裡給大家提供一個詳細的騰訊雲語音服務的配置教程。
專案已開源,程式碼地址:https://github.com/ddean2009/MoneyPrinterPlus
騰訊雲的具體配置
MoneyPrinterPlus在生成影片過程中需要進行一些語音合成和語音識別工作。
為了保證最後生成影片的質量,所以我們會用到一些雲廠商提供的語音合成和語音識別服務。
這裡騰訊云為例,來講解如何進行騰訊雲語音的配置。
獲取騰訊雲的access ID和Secret Key
首先我們到騰訊雲的官網上去註冊一個賬號,在最上面的搜尋框, 我們輸入訪問金鑰,在下面的控制檯入口,點選訪問金鑰,即可進入騰訊雲的訪問金鑰控制檯。
在API金鑰管理部分,點選右邊的新建金鑰,即可生成APPID,SecretID和SecretKey這三個值。
大家把這三個資料儲存下來。我們後面在MoneyPrinterPlus中會用到這三個值。
開通智慧語音服務
同樣的,我們在最上面的搜尋框中輸入語音合成,點選下方的控制檯入口--》語音合成按鈕,進入到語音合成介面。
進入語音合成介面之後,我們找到左邊的語音合成資源包,點選領取免費資源包,這樣可以領取免費的語音合成資源。
如果你的資源包用完了,沒關係, 我們點選左下角的語音合成設定,開通後付費服務即可。
同樣的,對於語音識別功能,我們同樣可以領取免費的語音識別資源包。
如果資源包不夠用的話,可以在語音識別設定中開通後付費服務。
這樣,我們在騰訊雲的語音合成和語音識別服務就開通好了。
在MoneyPrinterPlus中配置
啟動我們的專案,在web頁面點選最左邊的基礎配置,找到右邊的配置音訊庫資訊,選擇Tencent。
填入我們之前儲存的Access Key ID ,Access Key Secret和App Key。
回車後,這樣我們的配置就儲存了。
其他的配置
資源庫
資源庫指的是我們從哪裡獲取影片或者圖片資訊,這裡目前提供了兩個資源提供方,分別是pexels和pixabay。
大家任意選擇一個即可。
以pexels為例,我們登入pexels官網 https://www.pexels.com/zh-cn/ ,註冊一個賬號。
在圖片和影片API裡面,可以檢視自己的api金鑰。
檢視自己的API金鑰:
把這個API金鑰記下來,複製到MoneyPrinterPlus的配置即可。
![image-20240620170029227](/Users/wayne/Library/Application Support/typora-user-images/image-20240620170029227.png)
大模型配置
目前支援Moonshot,openAI,Azure openAI,Baidu Qianfan, Baichuan,Tongyi Qwen, DeepSeek這些。
國內要用的話推薦Moonshot(最近發現moonshot不太穩定,大家可以考慮Baichuan或者DeepSeek)。
同樣的到Moonshot開發者平臺上註冊一個key:https://platform.moonshot.cn/ 填入對應的配置即可。
AI短影片生成
有了基礎配置之後,就可以點選左邊的AI影片進入AI影片生成頁面。
- LLM影片文案生成
在影片主題區輸入你需要生成的影片主題,然後點選生成影片文案。
程式會自動使用大模型生成對應的影片文案和影片文案關鍵字:
如果你對影片文案或者關鍵字不滿意,可以手動進行修改。
- 影片配音區
在影片配音區可以選擇配音語言和對應的配音語言,目前支援100+配音語言。
還可以選擇不同的配音語速,以支援不同使用場景。
如果你對配音不太確定,可以點選試聽聲音試聽對應的配音語音。
- 背景音樂
背景音樂放在專案下的bgmusic目錄下面,你可以自行新增背景音樂檔案到該資料夾下面。
可以選擇是否開啟背景音樂,和預設的背景音樂音量。
- 影片配置區
影片配置區可以選擇影片佈局:豎屏,橫屏或者方形。
可以選擇影片幀率,影片的尺寸。
還可以選擇每個影片片段的最小長度和最大長度。
最最重要的,還可以開啟影片轉場特效。目前支援30+影片轉場特效。
- 字幕配置
如果你需要字幕,那麼可以點選開啟字幕選項,可以設定字幕字型,字幕字型的大小和字幕顏色等。
如果你不知道怎麼設定,選擇預設即可。
- 最後的影片生成
最後點選生成影片按鈕即可生成影片。
頁面會有相應的進度提醒。
最後生成的影片會展示在頁面最下面,大家可以自行播放。
點我檢視更多精彩內容:www.flydean.com