Fish Speech 更新V1.5:領先的多語言文字轉語音模型

千尺浪發表於2024-12-06

Fish Speech V1.5:領先的多語言文字轉語音模型

簡介

Fish Speech V1.5 是一個基於超過100萬小時多種語言音訊資料訓練的先進文字轉語音(TTS)模型。它以其高質量的語音輸出和廣泛的語言支援而聞名。

支援的語言

Fish Speech V1.5 支援以下語言:

  • 英語(en):超過300,000小時
  • 中文(zh):超過300,000小時
  • 日語(ja):超過100,000小時
  • 德語(de):約20,000小時
  • 法語(fr):約20,000小時
  • 西班牙語(es):約20,000小時
  • 韓語(ko):約20,000小時
  • 阿拉伯語(ar):約20,000小時
  • 俄語(ru):約20,000小時
  • 荷蘭語(nl):少於10,000小時
  • 義大利語(it):少於10,000小時
  • 波蘭語(pl):少於10,000小時
  • 葡萄牙語(pt):少於10,000小時

資源連結

  • Fish Speech 1.5整合包夸克網盤
  • 專案地址GitHub - fishaudio/fish-speech
  • 官網Fish Audio
  • 文件Fish Speech Documentation
  • Hugging Face模型Fish Speech 1.5 on Hugging Face

使用說明

以下是Fish Speech V1.5的簡單使用說明:

  1. 下載並解壓整合包:從夸克網盤下載Fish Speech 1.5整合包,並解壓到本地目錄。
  2. 執行推理頁面:解壓後,雙擊“雙擊我啟動.bat”檔案。
  3. 配置推理伺服器:在推理配置中勾選“開啟推理伺服器”選項。
  4. 訪問推理介面:推理介面將在http://127.0.0.1:7862上啟動,開啟瀏覽器新視窗,訪問http://127.0.0.1:7862/

結語

Fish Speech V1.5以其卓越的效能和廣泛的語言支援,為開發者和使用者提供了一個強大的文字轉語音解決方案。無論是在開發新應用還是提升現有系統的語音互動能力,Fish Speech V1.5都是一個值得考慮的選擇。

相關文章