On Маусым 26, 2025, Alibaba Cloud іске қосылды Qwen‑TTS, үлкен AI үлгілерінің Tongyi Qianwen (Qwen) отбасына соңғы қосылған. Әмбебап, жоғары сапалы мәтінді дыбысқа дейінгі қолданбаларға арналған Qwen-TTS қытай, ағылшын және аралас тілде енгізуді қолдайды және интеллектуалды дауыс көмекшілерінен мультимедиялық мазмұнды өндіруге дейін әртүрлі пайдалану жағдайларын қамтамасыз ететін топтамалық және ағынды аудио шығыстарды ұсынады.
Негізгі техникалық мүмкіндіктер
- Көптілді енгізу: Таза қытай, таза ағылшын немесе кодпен ауыстырылатын қытайша-ағылшынша мәтінді өңдейді, бұл жаһандық қолданбаларда үздіксіз дауыс синтезін қамтамасыз етеді. Бұған қоса, модель жеті екі тілді қытай-ағылшын дауыстық профильдерін ұсынады (мысалы, Cherry, Ethan, Chelsie, Serena), біркелкі кросс-тілдік тұтынушыларға қолдау көрсетуді жеңілдетеді, сондай-ақ жаһандық кросс-тілді білім беру қолданбалары, халықаралық мақсатты білім беру сияқты. аудитория.
- Ағынды шығыс: Толық аудио URL мекенжайын қамтамасыз ететін соңғы пакетпен Base64 кодталған сегменттер арқылы дыбысты нақты уақытта жеткізеді — аз кідіріс интерактивті сценарийлер үшін өте қолайлы.
- Токенге негізделген аудио кодтау: Аудионың әрбір 1 секундын 50 таңбалауышқа (кез келген ішінара дөңгелектенген) ішкі картаға түсіріп, әзірлеушілер үшін болжамды өнімділік пен түйіршіктілікті қамтамасыз етеді.
- Бірнеше дауыс мәнері: Алдын ала орнатылған дауыс палитрасын ұсынады—Шие, Серена, Итан, Челси, сонымен қатар Дилан, Джада, Санни— арнайы эмоционалды реңктерге және брендтік консистенцияға мүмкіндік береді.
- Жоғары өткізу және төмен кідіріс: Нақты уақыттағы ағынмен жіберу үшін оңтайландырылған Qwen‑TTS стандартты GPU даналарында 100 мс-ден төмен кідірістері бар аудио шығыстарды жасай алады, бұл оны интерактивті дауыс көмекшілері мен тікелей хабар тарату үшін тамаша етеді.
DashScope SDK арқылы үздіксіз интеграция
Qwen‑TTS-ке Alibaba Cloud модельдік студиясы және Qwen API соңғы нүктесі арқылы бірден қол жеткізуге болады. Әзірлеушілер модельді PAI‑EAS арқылы бірнеше рет басу арқылы орналастыра алады, оны SDK және OpenAPI-үйлесімді қоңыраулар арқылы жұмыс үрдістеріне біріктіре алады немесе Alibaba Cloud жүйесінде орналастырылған меншікті дауыстық деректер жиынын пайдаланып дәл баптай алады. Оның масштабталатын архитектурасы виртуалды байланыс орталықтары мен сөйлесу AI платформаларында топтамалық аудио генерацияны, сондай-ақ жедел синтезді қолдайды.
Alibaba Cloud Qwen‑TTS үшін интеграцияның жеңілдігіне басымдық беріп, қарапайым RESTful API және бірнеше тілдегі SDK. Python коды үлгісі минималды конфигурацияның (жай ғана API кілті үшін орта айнымалысын орнату) әзірлеушілерге Qwen‑TTS-ті бір функция шақыруымен шақыруға мүмкіндік беретінін көрсетеді. Мысалы:
pythonimport os
from qwen_sdk import SpeechSynthesizer
# Configure API key
os.environ = "your-api-key"
# Synthesize Beijing dialect speech
synthesizer = SpeechSynthesizer(model="qwen-tts-latest", voice="Dylan")
audio_url = synthesizer.synthesize(text="你好,欢迎使用 Qwen‑TTS!")
print(f"Audio available at: {audio_url}")
Бұл қарапайымдылық білім беру, медиа өндірісі, смарт құрылғылар және басқа салалардағы қолданбалардың нарыққа шығу уақытын жылдамдатады.
Пайдалану жағдайлары және салаға әсері
- Тұтынушыларға қызмет көрсетуді автоматтандыру: Компаниялар кіріс қоңыраулардың жоғары көлемін өңдеу үшін эмпатикалық, аймақтық екпінді дауыс агенттерін қолдана алады, бұл пайдаланушының қанағаттануын арттыра отырып, еңбек шығындарын азайтады.
- Мазмұнды жасау және медиа: Баспагерлер мен хабар таратушылар көптілді аудиокітаптарды, подкасттарды және кәсіби деңгейдегі сапаға сұраныс бойынша хабарландыруларды жасай алады.
- Арнайы мүмкіндіктер: Білім беру платформалары мен көмекші құрылғылар көру қабілеті бұзылған оқушылар мен пайдаланушылар үшін анық, тартымды дауыс шығыстарынан пайда көреді.
- Смарт құрылғылар және IoT: OEM құрылғылары Qwen‑TTS-ті киетін құрылғыларға, үй көмекшілеріне және көліктегі ақпараттық-ойын-сауық жүйелеріне жекелендірілген, мәтінмәнді ескеретін дауыстық өзара әрекеттесулерді қамтамасыз ете алады.
Басталу
CometAPI – OpenAI GPT сериялары, Google Gemini, Anthropic's Claude, Midjourney, Suno және т.б. сияқты жетекші провайдерлердің 500-ден астам AI үлгілерін бір, әзірлеушілерге ыңғайлы интерфейске біріктіретін бірыңғай API платформасы. Тұрақты аутентификацияны, сұрауды пішімдеуді және жауаптарды өңдеуді ұсына отырып, CometAPI қолданбаларыңызға AI мүмкіндіктерін біріктіруді айтарлықтай жеңілдетеді. Чат-боттарды, кескін генераторларын, музыкалық композиторларды немесе деректерге негізделген аналитикалық құбырларды құрастырып жатсаңыз да, CometAPI сізге AI экожүйесіндегі соңғы жетістіктерге қол жеткізе отырып, жылдамырақ қайталауға, шығындарды басқаруға және жеткізуші-агностикалық күйде қалуға мүмкіндік береді.
Бастау үшін үлгілердің мүмкіндіктерін зерттеңіз Ойын алаңы және кеңесіңіз API нұсқаулығы егжей-тегжейлі нұсқаулар үшін. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз.
Соңғы интеграция Qwen‑TTS API жақында CometAPI-де пайда болады, сондықтан хабардар болыңыз! Qwen‑VLo үлгісін жүктеп салуды аяқтағанша, басқа үлгілерімізді мына жерден зерттеңіз. Модельдер беті немесе оларды ішінде көріңіз AI ойын алаңы. Qwen компаниясының CometAPI-дегі соңғы үлгісі Qwen 3 API(qwen3-235b-a22b;qwen3-30b-a3b;qwen3-8b)
