人工智慧AI庫Spleeter免費人聲和背景音樂分離實踐(Python3.10)

劉悅的技術部落格發表於2023-04-17

原文網址 : https://www.cnblogs.com/v3ucn/p/17324656.html

在影片剪輯工作中，假設我們拿到了一段電影或者電視劇素材，如果直接在剪輯的影片中播放可能會遭遇版權問題，大部分情況需要分離其中的人聲和背景音樂，隨後替換背景音樂進行二次創作，人工智慧AI庫Spleeter可以幫我們完成大部分素材的人聲和背景音樂的分離流程。

Spleeter的模型源來自最大的音樂網站Deezer，底層基於深度學習框架Tensorflow，它可以透過模型識別出素材中的背景音樂素材，從而判斷出哪些是背景音樂，哪些是外部人聲。

Spleeter安裝

在終端執行執行pip命令：

pip3 install spleeter --user

安裝成功之後，輸入命令，檢查Spleeter安裝路徑：

pip show spleeter

程式返回：

PS C:\Users\liuyue\www\videosite> pip show spleeter                                        WARNING: Ignoring invalid distribution -umpy (c:\python39\lib\site-packages)               Name: spleeter                                                                             Version: 2.3.2  
Summary: The Deezer source separation library with pretrained models based on tensorflow.  
Home-page: https://github.com/deezer/spleeter  
Author: Deezer Research  
Author-email: spleeter@deezer.com  
License: MIT  
Location: c:\users\liuyue\appdata\roaming\python\python39\site-packages                    Requires: ffmpeg-python, httpx, librosa, llvmlite, norbert, numpy, pandas, protobuf, tensorflow, typer

說明安裝成功。

如果不想在本地搭建深度學習環境，也可以透過Docker映象安裝。關於Docker，請移步：一寸當機一寸血，十萬容器十萬兵|Win10/Mac系統下基於Kubernetes(k8s)搭建Gunicorn+Flask高可用Web叢集，這裡不在贅述。

執行Docker命令：

docker pull deezer/spleeter:3.8-5stems

這裡程式加上預訓練模型大概需要1.73GB的硬碟空間。

Spleeter分離人聲和背景音樂

Spleeter同時支援影片和音訊檔案的人聲和背景音樂分離，Spleeter自帶三種預訓練模型：

1、人聲&伴奏聲分離模型 2 stems，分離出兩個音軌

2、鼓聲、貝斯聲及其它聲分離模型 4 stems，分離出4個音軌)

3、鼓聲、貝斯聲、鋼琴聲及其它聲分離模型 5 stems，分離出5個音軌)

後面兩種模型相對比較精細，它可以把人聲、鼓聲、貝斯聲、鋼琴聲各自分離成多個音軌，一般適合音樂行業的專業人士進行使用。

大多數情況下，我們只需要使用第一種模型 2 stems 即可，它將音訊分離成兩個音軌，人聲和背景音樂的聲音：

spleeter separate -o /output/ -p spleeter:2stems /test.mp3

這裡-o代表輸出目錄，-p代表選擇的分離模型，最後是要分離的素材。

首次執行會比較慢，因為spleeter會下載預訓練模型，體積在1.73g左右，執行完畢後，會在輸出目錄生成分離後的音軌檔案：

accompaniment.wav  
vocals.wav

accompaniment.wav代表人聲，vocals.wav是背景音樂。

如果是基於Docker安裝的，則需要執行對應的Docker命令：

docker run -v $(pwd)/output:/output deezer/spleeter:3.8-5stems separate test.mp3 -o /output

結語

Spleeter可以算是免費的人聲和背景音樂分離功能的最佳本地方案了，除了影視劇素材的人聲和背景音樂分離的二次創作，如果是在外部環境錄製的Vlog，環境音非常嘈雜，而又不得不現場錄音，那麼使用Spleeter也可以將人聲從環境音中分離出來，節省了二次錄製畫外音的環節。

免費背景音人聲分離解決方案MVSEP-MDX23,足以和Spleeter分庭抗禮
2023-12-29
華為音訊編輯服務，實時分離人聲、伴奏和樂器聲
2022-03-22
音訊
含辭未吐,聲若幽蘭,史上最強免費人工智慧AI語音合成TTS服務微軟Azure(Python3.10接入)
2022-12-25
人工智慧AITTS微軟Python
自媒體人必看！這些無版權背景音樂網站，免費下載
2022-05-06
網站
MIT又出新玩法，利用AI可輕鬆分離視訊中的樂器聲音
2018-07-09
MITAI
.Net開發的音訊分離桌面應用，可用於提取背景音樂
2023-05-08
音訊
聞其聲而知雅意,基於Pytorch(mps/cpu/cuda)的人工智慧AI本地語音識別庫Whisper(Python3.10)
2023-01-17
PyTorch人工智慧AIPython
免費！位元組這款AI音樂神器，30秒速成抖音神曲
2024-08-06
AI
口播神器,基於Edge,微軟TTS(text-to-speech)文字轉語音免費開源庫edge-tts實踐(Python3.10)
2023-03-07
微軟TTSPython
聲音好聽,顏值能打,基於PaddleGAN給人工智慧AI語音模型配上動態畫面(Python3.10)
2023-05-18
人工智慧AI模型Python
吾劍未嘗不利,國內Azure平替,科大訊飛人工智慧免費AI語音合成(TTS)服務Python3.10接入
2023-02-08
人工智慧AITTSPython
AI歌姬,C位出道,基於PaddleHub/Diffsinger實現音訊歌聲合成操作(Python3.10)
2023-11-14
AI音訊Python
Listen1 Mac付費音樂免費聽神器
2022-03-18
Mac
動漫&漫畫&音樂&小說免費
2024-06-10
一款非常強大的從電影中提取人聲、提取音樂、提取特效聲的AI工具
2024-04-26
特效AI
mac音樂分離器：Algoriddim Neural Mix Pro for mac
2023-12-31
MacGo
網易雲音樂網路庫跨平臺化實踐
2021-11-18
國外五個免費版權音樂網站
2019-03-05
網站
《最終幻想 7 重製版》音樂訪談：如何將聲音與背景融為一體？
2020-05-06
如何建立免費版本的ABP分離模組？
2024-10-07
雲音樂預案平臺實踐
2022-03-08
雲音樂FeatureStore建設與實踐
2022-06-29
REST
js隨機切換背景音樂
2018-05-27
JS隨機
Helio for mac(音樂創作工具) v3.3免費版
2020-12-28
Mac
StoneDB 讀寫分離實踐方案
2022-10-11
AI音樂，騰訊音樂、網易雲音樂的新版圖？
2022-02-16
AI
免費剪輯音樂的軟體都有哪些？音訊剪輯方法分享？
2020-11-30
音訊
【JS逆向百例】某音樂網分離式 webpack 非 IIFE 改寫實戰
2021-11-04
JSWeb
免費且離線的同聲翻譯利器「GitHub 熱點速覽」
2024-06-25
Github
任務拆解,悠然自得,自動版本的ChatGPT,AutoGPT自動人工智慧AI任務實踐(Python3.10)
2023-04-18
ChatGPT人工智慧AIPython
AI天后,線上飆歌,人工智慧AI孫燕姿模型應用實踐，復刻《遙遠的歌》，原唱晴子(Python3.10)
2023-05-11
AI人工智慧模型Python
Listen1 2.12.3 中文版 (全網付費VIP音樂免費聽)
2020-08-26
Listen1 2.17.8 中文版 (全網付費VIP音樂免費聽)
2020-12-30
Python爬蟲實踐-網易雲音樂
2018-09-09
Python爬蟲
雲音樂 Swift 混編 Module 化實踐
2023-03-07
Swift
RocketMQ 在網易雲音樂的實踐
2022-12-12
MQ
Mac——免費的音樂編輯軟、影片編輯軟體。
2024-06-30
Mac
js播放背景音樂失敗處理
2024-05-13
JS

人工智慧AI庫Spleeter免費人聲和背景音樂分離實踐(Python3.10)

Spleeter安裝

Spleeter分離人聲和背景音樂

結語

相關文章