阿里雲發布 Qwen-TTS:高傳真串流語音合成模型

CometAPI
AnnaJun 30, 2025
阿里雲發布 Qwen-TTS:高傳真串流語音合成模型

On 2025 年 6 月 26 日阿里雲推出 Qwen‑TTS這是其統一千文(Qwen)大型 AI 模型系列的最新成員。 Qwen-TTS 專為多功能、高品質的文字轉語音應用而設計,支援中文、英文和混合語言輸入,並提供大量和串流音訊輸出,滿足從智慧語音助理到多媒體內容製作等各種用例的需求。

主要技術特點

  • 多語言輸入:可處理純中文、純英文或中英代碼轉換的文本,實現全球應用程式中的無縫語音合成。此外,該模型提供七種中英雙語語音檔案(例如Cherry、Ethan、Chelsie、Serena),可實現無縫的跨語言應用,例如全球客戶支援、教育輔導和針對國際受眾的多媒體內容。
  • 串流輸出:透過 Base64 編碼段即時傳送音頻,最終包提供完整的音頻 URL - 非常適合低延遲交互場景。
  • 基於令牌的音訊編碼:內部將每 1 秒的音訊對應到 50 個標記(任何部分秒都會向上舍入),確保開發人員可預測的效能和粒度。
  • 多種聲音風格:提供預設聲音調色盤—櫻桃、瑟琳娜、伊森、切爾西,以及 迪倫、賈達、桑尼—允許客製化情感基調和品牌一致性。
  • 高吞吐量和低延遲:Qwen-TTS 針對即時串流媒體進行了最佳化,可以在標準 GPU 實例上產生端到端延遲低於 100 毫秒的音訊輸出,使其成為互動式語音助理和直播的理想選擇。

透過 DashScope SDK 無縫集成

Qwen‑TTS 可透過阿里雲 Model Studio 和 Qwen API 端點立即存取。開發者只需點擊幾下即可透過 PAI‑EAS 部署模型,透過 SDK 和相容 OpenAPI 的呼叫將其整合到工作流程中,或使用阿里雲上託管的專有語音資料集進行微調。其可擴展的架構支援批量音訊生成以及虛擬呼叫中心和對話式 AI 平台中的即時合成。

阿里雲優先考慮 Qwen-TTS 的整合便利性,提供 簡單的 RESTful API 以及多種語言的 SDK。範例 Python 程式碼示範如何透過極簡配置(只需設定 API 金鑰的環境變數)讓開發者透過單一函式呼叫即可呼叫 Qwen-TTS。例如:

pythonimport os
from qwen_sdk import SpeechSynthesizer

# Configure API key

os.environ = "your-api-key"

# Synthesize Beijing dialect speech

synthesizer = SpeechSynthesizer(model="qwen-tts-latest", voice="Dylan")
audio_url = synthesizer.synthesize(text="你好,欢迎使用 Qwen‑TTS!")
print(f"Audio available at: {audio_url}")

這種簡單性加快了教育、媒體製作、智慧型裝置等領域應用程式的上市時間。

用例和行業影響

  • 客戶服務自動化:公司可以部署富有同情心、帶有當地口音的語音代理來處理大量來電,從而降低勞動力成本並提高用戶滿意度。
  • 內容創作與媒體:出版商和廣播公司可以製作具有專業級品質的多語言有聲書、播客和點播公告。
  • 無障礙服務:教育平台和輔助設備將受益於為有視力障礙的學習者和使用者提供清晰、引人入勝的語音輸出。
  • 智慧型設備和物聯網:OEM 可以將 Qwen-TTS 嵌入穿戴式裝置、家庭助理和車載資訊娛樂系統,以提供個人化、情境感知的語音互動。

入門

CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。

首先,探索模型在 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。

最新整合 Qwen‑TTS API 即將出現在 CometAPI 上,敬請期待!在我們完成 Qwen‑VLo 模型上傳的同時,探索我們在 模型頁面 或者嘗試一下 人工智能遊樂場. Qwen 在 CometAPI 中的最新模型是 Qwen 3 API(qwen3-235b-a22b;qwen3-30b-a3b;qwen3-8b)

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣