Alibaba Cloud 发布 Qwen‑TTS: 一款高保真、流式语音合成模型

CometAPI
AnnaJun 30, 2025
Alibaba Cloud 发布 Qwen‑TTS: 一款高保真、流式语音合成模型

2025年6月26日,Alibaba Cloud 推出了 Qwen‑TTS,这是其 Tongyi Qianwen (Qwen) 大模型家族的最新成员。Qwen‑TTS 面向多样化、高质量的文本转语音应用,支持中文、英文及混合语言输入,并提供批量与流式音频输出,满足从智能语音助手到多媒体内容生产的多种场景。

关键技术特性

  • 多语输入:支持处理纯中文、纯英文或中英语码切换文本,实现面向全球应用的无缝语音合成。另外,模型提供七种中英双语音色(如 Cherry、Ethan、Chelsie、Serena),助力跨语言场景,如全球客户支持、教育辅导以及面向国际受众的多媒体内容制作。
  • 流式输出:通过 Base64 编码的分段实时传输音频,最终包提供完整的音频 URL,非常适合低延迟的交互场景。
  • 基于 Token 的音频编码:内部将每 1 秒音频映射为 50 个 token(不足 1 秒按向上取整),为开发者提供可预期的性能与粒度。
  • 多样化音色:提供一组预设声音——Cherry、Serena、Ethan、Chelsie,以及 Dylan、Jada、Sunny——支持定制情感语调与品牌一致性。
  • 高吞吐与低时延:针对实时流式优化,Qwen‑TTS 在标准 GPU 实例上可实现端到端时延低于 100 ms 的音频生成,非常适合互动语音助手与直播场景。

通过 DashScope SDK 的无缝集成

Qwen‑TTS 可通过 Alibaba Cloud 的 Model Studio 和 Qwen API 端点立即访问。开发者只需几次点击即可通过 PAI‑EAS 部署模型,可通过 SDK 和符合 OpenAPI 的调用集成到工作流中,或使用托管在 Alibaba Cloud 上的私有语音数据集进行微调。其可扩展架构同时支持批量音频生成与在虚拟呼叫中心和对话式 AI 平台中的实时合成。

为提升集成便捷性,Alibaba Cloud 为 Qwen‑TTS 提供了简明的 RESTful API与多语言 SDK。以下示例 Python 代码展示了如何通过极少配置——只需为 API 密钥设置环境变量——即可通过一次函数调用使用 Qwen‑TTS。例如:

pythonimport os
from qwen_sdk import SpeechSynthesizer

# 配置 API 密钥

os.environ = "your-api-key"

# 合成北京方言语音

synthesizer = SpeechSynthesizer(model="qwen-tts-latest", voice="Dylan")
audio_url = synthesizer.synthesize(text="你好,欢迎使用 Qwen‑TTS!")
print(f"音频地址:{audio_url}")

这种简洁性加速了教育、媒体生产、智能设备等领域应用的上市进程。

使用场景与行业影响

  • 客户服务自动化:企业可部署具备同理心、带有地区口音的语音坐席,以处理大量来电,在降低人力成本的同时提升用户满意度。
  • 内容创作与媒体:出版机构与广播平台可生成多语种有声书、播客与按需公告,达到专业级音质。
  • 无障碍:教育平台与辅助设备可为学习者及视障用户提供清晰、富有吸引力的语音输出,从而获益。
  • 智能设备与 IoT:OEM 厂商可将 Qwen‑TTS 集成至可穿戴设备、家庭助手与车载信息娱乐系统,实现个性化、具备上下文感知的语音交互。

入门指南

CometAPI 是一个统一的 API 平台,将来自领先提供商的 500 余款 AI 模型(如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)聚合到一个对开发者友好的界面之中。通过提供一致的身份验证、请求格式与响应处理,CometAPI 显著简化了将 AI 能力集成到应用中的流程。无论你在构建聊天机器人、图像生成器、音乐作曲器,还是数据驱动的分析管道,CometAPI 都能助你更快迭代、控制成本,并保持与供应商无关,同时汲取 AI 生态中的最新突破。

要开始使用,请在 Playground 中探索模型的能力,并查阅 API 指南 获取详细说明。在访问前,请确保已登录 CometAPI 并获取 API 密钥。

最新集成的 Qwen‑TTS API 即将登陆 CometAPI,敬请期待!在我们完成 Qwen‑VLo Model 上传期间,欢迎在 Models 页面 浏览其他模型,或在 AI Playground 进行体验。Qwen 在 CometAPI 上的最新模型为 Qwen 3 API(qwen3-235b-a22b;qwen3-30b-a3b;qwen3-8b)

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣