如何呼叫openai的TTS模型

ScopeAstro發表於2024-09-04

原文網址 : https://www.cnblogs.com/DanielSong/p/18397362

OpenAITTS模型

這是24年1月份寫的了，呼叫程式碼大機率有變動，僅供參考。

1 什麼是OpenAI的TTS模型

OpenAI的TTS模型是一種文字到語音（Text-to-Speech）模型，它可以將給定的文字轉換為自然語音音訊。TTS代表Text-to-Speech，是一種人工智慧技術，它使計算機能夠模擬自然語言的聲音，從而實現文字的朗讀。

在OpenAI的TTS模型中，使用者可以選擇不同的聲音（Voice）和模型型別（Model），以定製生成語音的效果。聲音可以是男聲或女聲，而模型型別可以選擇不同的版本，如"tts-1"或"tts-1-hd"，以滿足不同的需求。

"tts-1"：
- "tts-1"是OpenAI TTS的基本版本。
- 相對較小的模型，適用於一般的文字到語音轉換任務。
- 生成的語音質量較好，但可能在某些情況下缺少一些細節。
"tts-1-hd"：
- "tts-1-hd"是"tts-1"的高畫質版本，具有更高的模型容量和更多的引數。
- 更大的模型容量通常意味著能夠更好地捕捉文字中的複雜結構和音訊細節。
- 適用於對語音質量有更高要求的場景，如音訊合成、語音應用等。

選擇使用哪個版本通常取決於任務的要求和對語音質量的期望。如果對生成語音的質量要求較高，可能會選擇使用"tts-1-hd"，而對於一般應用，"tts-1"也提供了良好的效能。在實際使用中，可以嘗試兩個版本並比較它們在特定任務上的效果。

2 api收費情況

$0.015/0.03 per 1,000 input characters，即1000字元0.015美元。

3 如何使用OpenAI的TTS模型

使用OpenAI的TTS模型需要透過API進行呼叫。以下是使用OpenAI的TTS模型的基本步驟：
該庫需要在全域性魔法上網環境下使用，若出現connect error類報錯，就是節點問題

3.1 步驟：

3.1.1 獲取OpenAI API金鑰

在使用TTS模型之前，需要獲得OpenAI的API金鑰。API金鑰是用於身份驗證的關鍵資訊。具體獲取方式請自行查閱。

3.1.2 安裝OpenAI Python庫

使用Python指令碼呼叫OpenAI的API，需要安裝OpenAI的Python庫。可以使用以下命令進行安裝：

pip install openai
pip install openai -i https://pypi.tuna.tsinghua.edu.cn/simple  # 清華映象安裝，二者任選其一即可。

3.1.3 編寫Python指令碼

編寫Python指令碼，匯入所需的庫（如openai、pathlib等），並配置OpenAI的API金鑰。

from pathlib import Path
from openai import OpenAI  # 要求openai庫版本1.0以上

# 配置OpenAI的API金鑰
client = OpenAI(api_key="your_api_key")

# 設定檔案路徑
speech_file_path = Path(__file__).parent / "speech.mp3"

3.1.4 使用TTS模型生成語音

在指令碼中呼叫OpenAI的TTS模型，指定模型型別、聲音型別和輸入文字，然後將生成的語音儲存到檔案。

# 呼叫OpenAI的TTS模型
response = client.audio.speech.create(
    model="tts-1-hd", # 模型選擇
    voice="echo",  # 不同語音模式選擇
    input="你好，世界！"  # 生成內容選擇
)

# 將生成的語音儲存到檔案
response.stream_to_file(speech_file_path)

3.1.5 不同的語音模式（voice option）

ChatGPT 在OpenAI的TTS-1模型中，Alloy、Echo、Fable、Onyx、Nova和Shimmer代表不同的語音模式或聲音型別。每種語音模式都具有獨特的音質、音調和語音特點。以下是對這六種語音模式的簡要介紹：

Alloy（合金）：
- Alloy 是一種女聲語音模式。
- 聲音可能具有音樂感，適用於一般性的語音合成任務。
Echo（回聲）：
- Echo 是一種男聲語音模式。
- 可能具有較深的音調，適用於需要男聲的場景。
Fable（寓言）：
- Fable 是一種語音模式，具有獨特的聲音特點。
- 可能呈現出富有魅力和講故事感的音質。
Onyx（黑瑪瑙）：
- Onyx 是一種語音模式，可能具有深沉和富有表現力的音質。
- 適用於需要更加莊重和深情的場景。
Nova（新星）：
- Nova 是一種語音模式，可能呈現出明亮、清晰和生動的音質。
- 適用於需要更加活潑和清晰的語音的場景。
Shimmer（閃光）：
- Shimmer 是一種語音模式，可能具有更加明亮和閃耀的音質。
- 適用於需要更加活潑和輕鬆的場景。

3.1.6 配置

3.1.6.1 法一配置代理後，再開代理軟體

_base_client.py ps：這個檔案我忘了在哪了，應該在opneai這個包裡。

proxies = {
    'http://':'http://127.0.0.1:埠',
    'https://': 'http://127.0.0.1:埠'
}

3.1.6.2 法二開全域性代理（必須是tun模式，i.e 改網路卡的那種）

3.1.7 執行指令碼

執行編寫好的Python指令碼，根據需要提供相應的命令列引數，如API金鑰、模型型別、聲音型別和輸入文字。
也可以在ide中直接執行，不用按照如下方式

python your_script.py --api_key="your_api_key" --model="tts-1-hd" --voice="echo" --input_text="你好，世界！"

3.1.8 完整程式碼

from pathlib import Path
from openai import OpenAI
client = OpenAI(api_key="your_api_key")  # 此處屬於你的api

speech_file_path = Path(__file__).parent / "speech.mp3"  # 設定檔案路徑
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)  # 生成的文字內容，支援中文

response.stream_to_file(speech_file_path)

透過Jupyter Notebook+OpenAI+ollama簡單的呼叫本地模型
2024-07-27
OpenAI模型
理解 OpenAI 的 CLIP 模型
2024-07-10
OpenAI模型
教你如何在 Andorid 上使用OpenAI API 呼叫ChatGpt
2023-03-26
OpenAIAPIChatGPT
手把手教你國內開發者如何呼叫openai的介面
2023-04-17
OpenAI
吳恩達出手，開源最新Python包，一個介面呼叫OpenAI等模型
2024-11-26
吳恩達PythonOpenAI模型
TTS 擂臺: 文字轉語音模型的自由搏擊場
2024-03-16
TTS模型
WebRTC 作者加入 OpenAI 主導實時 AI 專案；TTS 小模型 OuteTTS v0.2 釋出：聲音克隆 + 多語言
2024-11-26
WebOpenAITTS模型
WebRTC 作者加入 OpenAI 主導實時 AI 專案；TTS 小模型 OuteTTS v0.2 釋出：聲音克隆+多語言
2024-11-26
WebOpenAITTS模型
OpenAI Sora真的有自己的物理模型嗎？
2024-02-18
OpenAISora模型
ChatTTS,語氣韻律媲美真人的開源TTS模型,文字轉語音界的新魁首,對標微軟Azure-tts
2024-05-31
TTS模型微軟
opencv呼叫caffe模型
2019-04-04
OpenCV模型
Java 呼叫 PaddleDetection 模型
2023-02-20
Java模型
[需求建議]跨模型呼叫？分類能呼叫單獨模型？
2019-05-11
模型
OpenAI推出ChatGPT對話式AI模型
2022-12-04
OpenAIChatGPT模型
如何讓其他模型也能在SemanticKernel中呼叫本地函式
2024-07-05
模型函式
如何註冊 ChatGPT ,OpenAI
2023-02-10
ChatGPTOpenAI
如何申請 Azure OpenAI
2023-04-04
OpenAI
OpenAI 是怎麼“壓力測試”大型語言模型的？
2024-11-22
OpenAI模型
使用.NET開發搭建OpenAI模型的中間服務端
2022-12-16
OpenAI模型服務端
藏不住了！OpenAI的推理模型有時用中文「思考」
2025-01-15
OpenAI模型
下一個GAN？OpenAI提出可逆生成模型Glow
2018-07-10
OpenAI模型
pydantic+openai+json: 控制大模型輸出的最佳正規化
2024-06-18
OpenAIJSON大模型
OpenAI 推出迄今為止最先進的推理模型 o3
2024-12-21
OpenAI模型
大模型111人：谷歌和OpenAI的人才戰爭
2023-03-07
大模型谷歌OpenAI
文字到語音(tts)
2024-05-02
TTS
Coqui TTS合成語音
2024-12-03
UITTS
WinMain是如何被呼叫的
2022-01-08
AI
這就是OpenAI神秘的Q*？史丹佛：語言模型就是Q函式
2024-04-24
OpenAI模型函式
TensorFlow 呼叫預訓練好的模型—— Python 實現
2018-10-10
模型Python
第9章使用Scikit-Learn呼叫Keras的模型
2018-06-01
Keras模型
位元組打造大模型TTS：不僅能高保真合成，而且支援調整編輯
2024-06-18
大模型TTS
OpenAI CEO表示巨型AI模型時代已經結束
2023-04-24
OpenAI模型
重磅釋出：OpenAI o1全新推理模型系列
2024-09-19
OpenAI模型
ML.NET呼叫Tensorflow模型示例——MNIST
2019-05-21
模型
首個支援普通話和方言混說的TTS大模型：河南話、上海話、粵語說得溜
2024-08-13
TTS大模型
OpenAI「草莓」模型再次跳票，凌晨釋出的SWE-bench Verified是個啥？
2024-08-14
OpenAI模型
OpenAI o1 模型到來後，談談提示詞工程的未來
2024-12-09
OpenAI模型
pyav 是如何呼叫 FFmpeg libraries 的？
2023-03-03