MoneyPrinterPlus可以使用大模型自動生成短影片,我們可以藉助Azure提供的語音服務來實現語音合成和語音識別的功能。
Azure的語音服務應該是我用過的效果最好的服務了,微軟還得是微軟。
很多小夥伴可能不知道應該如何配置,這裡給大家提供一個詳細的Azure語音服務的配置教程。
專案已開源,程式碼地址:https://github.com/ddean2009/MoneyPrinterPlus
Azure的具體配置
因為Azure的註冊需要用到VISA,所以阻止了很多想要進一步探索的小夥伴。
其實,MoneyPrinterPlus也是支援國內的雲廠商,比如阿里雲和騰訊雲。所以,如果註冊Azure有困難的小夥伴,可以參考我的另外兩篇使用阿里雲和騰訊雲的介紹文章。
這裡Azure為例,來講解如何進行Azure語音的配置。
獲取Azure的Speech Key和Service Region
首先我們到Azure的官網上去註冊一個賬號,怎麼註冊這裡就不講了,反正很簡單,註冊成功還可以免費使用一年的微軟雲服務,非常的棒。
有了賬號,並且登入賬號之後,在搜尋框輸入語音服務:
點選下面的語音服務,進入到Azure的語音服務頁面。
到語音服務這裡,點選建立按鈕,會進入建立語音服務頁面:
填上必須的內容。點選審閱並建立,就可以建立好Azure的服務了。
記住你的金鑰和region:
在MoneyPrinterPlus中配置
啟動我們的專案,在web頁面點選最左邊的基礎配置,找到右邊的配置音訊庫資訊,選擇Tencent。
填入我們之前儲存的金鑰和region。
回車後,這樣我們的配置就儲存了。
其他的配置
資源庫
資源庫指的是我們從哪裡獲取影片或者圖片資訊,這裡目前提供了兩個資源提供方,分別是pexels和pixabay。
大家任意選擇一個即可。
以pexels為例,我們登入pexels官網 https://www.pexels.com/zh-cn/ ,註冊一個賬號。
在圖片和影片API裡面,可以檢視自己的api金鑰。
檢視自己的API金鑰:
把這個API金鑰記下來,複製到MoneyPrinterPlus的配置即可。
![image-20240620170029227](/Users/wayne/Library/Application Support/typora-user-images/image-20240620170029227.png)
大模型配置
目前支援Moonshot,openAI,Azure openAI,Baidu Qianfan, Baichuan,Tongyi Qwen, DeepSeek這些。
國內要用的話推薦Moonshot(最近發現moonshot不太穩定,大家可以考慮Baichuan或者DeepSeek)。
同樣的到Moonshot開發者平臺上註冊一個key:https://platform.moonshot.cn/ 填入對應的配置即可。
AI短影片生成
有了基礎配置之後,就可以點選左邊的AI影片進入AI影片生成頁面。
- LLM影片文案生成
在影片主題區輸入你需要生成的影片主題,然後點選生成影片文案。
程式會自動使用大模型生成對應的影片文案和影片文案關鍵字:
如果你對影片文案或者關鍵字不滿意,可以手動進行修改。
- 影片配音區
在影片配音區可以選擇配音語言和對應的配音語言,目前支援100+配音語言。
還可以選擇不同的配音語速,以支援不同使用場景。
如果你對配音不太確定,可以點選試聽聲音試聽對應的配音語音。
- 背景音樂
背景音樂放在專案下的bgmusic目錄下面,你可以自行新增背景音樂檔案到該資料夾下面。
可以選擇是否開啟背景音樂,和預設的背景音樂音量。
- 影片配置區
影片配置區可以選擇影片佈局:豎屏,橫屏或者方形。
可以選擇影片幀率,影片的尺寸。
還可以選擇每個影片片段的最小長度和最大長度。
最最重要的,還可以開啟影片轉場特效。目前支援30+影片轉場特效。
- 字幕配置
如果你需要字幕,那麼可以點選開啟字幕選項,可以設定字幕字型,字幕字型的大小和字幕顏色等。
如果你不知道怎麼設定,選擇預設即可。
- 最後的影片生成
最後點選生成影片按鈕即可生成影片。
頁面會有相應的進度提醒。
最後生成的影片會展示在頁面最下面,大家可以自行播放。
點我檢視更多精彩內容:www.flydean.com