On جون 26، 2025، علی بابا کلاؤڈ کا آغاز Qwen-TTS، بڑے AI ماڈلز کے ٹونگی کیان وین (کیوین) فیملی میں تازہ ترین اضافہ۔ ورسٹائل، اعلیٰ معیار کے ٹیکسٹ ٹو اسپیچ ایپلی کیشنز کے لیے ڈیزائن کیا گیا، Qwen-TTS چینی، انگریزی، اور مخلوط زبان کے ان پٹ کو سپورٹ کرتا ہے اور بیچ اور اسٹریمنگ آڈیو آؤٹ پٹ دونوں پیش کرتا ہے، ذہین صوتی معاونین سے لے کر ملٹی میڈیا مواد کی تیاری تک مختلف استعمال کے معاملات کو پورا کرتا ہے۔
کلیدی تکنیکی خصوصیات
- کثیر لسانی ان پٹ: خالص چینی، خالص انگریزی، یا کوڈ-سوئچڈ چینی-انگریزی متن پر عمل کرتا ہے، جس سے عالمی ایپلی کیشنز میں ہموار آواز کی ترکیب کو فعال کیا جاتا ہے۔ اس کے علاوہ، ماڈل سات دو لسانی چینی-انگریزی صوتی پروفائلز پیش کرتا ہے (مثلاً، چیری، ایتھن، چیلسی، سرینا)، ہموار ایپلی کیشن کی سہولت فراہم کرتا ہے اور ملٹی لیس ایپلیکیشن کراس میڈیا، ٹیوگولٹر، عالمی سطح پر تعلیمی مواد کی سہولت فراہم کرتا ہے۔ بین الاقوامی سامعین کو نشانہ بنانا۔
- سٹریمنگ آؤٹ پٹ: ایک مکمل آڈیو URL فراہم کرنے والے حتمی پیکیج کے ساتھ، Base64-انکوڈ شدہ حصوں کے ذریعے حقیقی وقت میں آڈیو ڈیلیور کرتا ہے—کم تاخیر کے متعامل منظرناموں کے لیے مثالی۔
- ٹوکن پر مبنی آڈیو انکوڈنگ: اندرونی طور پر آڈیو کے ہر 1 سیکنڈ کو 50 ٹوکنز پر نقشہ بناتا ہے (کسی بھی جزوی سیکنڈ کے ساتھ)، ڈویلپرز کے لیے قابل پیشن گوئی کارکردگی اور گرانولریٹی کو یقینی بناتا ہے۔
- متعدد آواز کے انداز: پیش سیٹ آوازوں کا ایک پیلیٹ پیش کرتا ہے۔چیری، سرینا، ایتھن، چیلسی، اسی طرح ڈیلن، جاڈا، سنی- موزوں جذباتی لہجے اور برانڈنگ کی مستقل مزاجی کی اجازت دینا۔
- ہائی تھرو پٹ اور کم تاخیر: ریئل ٹائم اسٹریمنگ کے لیے بہتر بنایا گیا، Qwen-TTS معیاری GPU مثالوں پر 100 ms سے کم وقفے کے ساتھ آڈیو آؤٹ پٹ تیار کر سکتا ہے، جو اسے انٹرایکٹو صوتی معاونین اور لائیو براڈکاسٹنگ کے لیے مثالی بناتا ہے۔
DashScope SDK کے ذریعے سیملیس انٹیگریشن
Qwen‑TTS علی بابا کلاؤڈ کے ماڈل اسٹوڈیو اور Qwen API اینڈ پوائنٹ کے ذریعے فوری طور پر قابل رسائی ہے۔ ڈیولپرز صرف چند کلکس کے ساتھ PAI‑EAS کے ذریعے ماڈل کو تعینات کر سکتے ہیں، اسے SDKs اور OpenAPI-مطابق کالوں کے ذریعے ورک فلو میں ضم کر سکتے ہیں، یا Alibaba Cloud پر ہوسٹ کردہ ملکیتی صوتی ڈیٹا سیٹس کا استعمال کرتے ہوئے اسے ٹھیک کر سکتے ہیں۔ اس کا توسیع پذیر فن تعمیر بیچ آڈیو جنریشن کے ساتھ ساتھ ورچوئل کال سینٹرز اور بات چیت کے AI پلیٹ فارمز میں فلائی ترکیب کو بھی سپورٹ کرتا ہے۔
علی بابا کلاؤڈ نے Qwen-TTS کے لیے انضمام کی آسانی کو ترجیح دی ہے، پیش کش سیدھا آرام دہ API اور متعدد زبانوں میں SDKs۔ نمونہ ازگر کوڈ اس بات کی وضاحت کرتا ہے کہ کس طرح کم سے کم کنفیگریشن — صرف API کلید کے لیے ایک ماحولیاتی متغیر ترتیب دینا — ڈویلپرز کو ایک فنکشن کال کے ساتھ Qwen-TTS کو طلب کرنے کے قابل بناتا ہے۔ مثال کے طور پر:
pythonimport os
from qwen_sdk import SpeechSynthesizer
# Configure API key
os.environ = "your-api-key"
# Synthesize Beijing dialect speech
synthesizer = SpeechSynthesizer(model="qwen-tts-latest", voice="Dylan")
audio_url = synthesizer.synthesize(text="你好,欢迎使用 Qwen‑TTS!")
print(f"Audio available at: {audio_url}")
یہ سادگی تعلیم، میڈیا پروڈکشن، سمارٹ ڈیوائسز اور اس سے آگے کی ایپلی کیشنز کے لیے مارکیٹ میں وقت کو تیز کرتی ہے۔
کیسز اور انڈسٹری کے اثرات کا استعمال کریں۔
- کسٹمر سروس آٹومیشن: کمپنیاں ہمدرد، علاقائی طور پر لہجے والے صوتی ایجنٹوں کو ان باؤنڈ کالوں کی زیادہ مقدار کو ہینڈل کرنے کے لیے تعینات کر سکتی ہیں، صارف کے اطمینان کو بڑھاتے ہوئے مزدوری کے اخراجات کو کم کر سکتی ہیں۔
- مواد کی تخلیق اور میڈیا: پبلشرز اور براڈکاسٹر پیشہ ورانہ معیار کے ساتھ کثیر لسانی آڈیو بکس، پوڈکاسٹ، اور آن ڈیمانڈ اعلانات تیار کر سکتے ہیں۔
- رسائی: تعلیمی پلیٹ فارمز اور معاون آلات سیکھنے والوں اور بصارت سے محروم صارفین کے لیے واضح، دلکش آواز کے آؤٹ پٹس سے فائدہ اٹھاتے ہیں۔
- اسمارٹ ڈیوائسز اور آئی او ٹی: OEMs Qwen-TTS کو پہننے کے قابل، گھریلو معاونین، اور گاڑی میں انفوٹینمنٹ سسٹم میں شامل کر سکتے ہیں تاکہ ذاتی نوعیت کے، سیاق و سباق سے آگاہ صوتی تعاملات فراہم کر سکیں۔
شروع
CometAPI ایک متحد API پلیٹ فارم ہے جو سرکردہ فراہم کنندگان سے 500 سے زیادہ AI ماڈلز کو اکٹھا کرتا ہے — جیسے OpenAI کی GPT سیریز، Google کی Gemini، Anthropic's Claude، Midjourney، Suno، اور مزید — ایک واحد، ڈویلپر کے موافق انٹرفیس میں۔ مسلسل تصدیق، درخواست کی فارمیٹنگ، اور رسپانس ہینڈلنگ کی پیشکش کرکے، CometAPI ڈرامائی طور پر آپ کی ایپلی کیشنز میں AI صلاحیتوں کے انضمام کو آسان بناتا ہے۔ چاہے آپ چیٹ بوٹس، امیج جنریٹرز، میوزک کمپوزر، یا ڈیٹا سے چلنے والی اینالیٹکس پائپ لائنز بنا رہے ہوں، CometAPI آپ کو تیزی سے اعادہ کرنے، لاگت کو کنٹرول کرنے، اور وینڈر-ایگنوسٹک رہنے دیتا ہے—یہ سب کچھ AI ماحولیاتی نظام میں تازہ ترین کامیابیوں کو حاصل کرنے کے دوران۔
شروع کرنے کے لیے، میں ماڈلز کی صلاحیتوں کو دریافت کریں۔ کھیل کے میدان اور مشورہ کریں API گائیڈ تفصیلی ہدایات کے لیے۔ رسائی کرنے سے پہلے، براہ کرم یقینی بنائیں کہ آپ نے CometAPI میں لاگ ان کیا ہے اور API کلید حاصل کر لی ہے۔
تازہ ترین انضمام Qwen-TTS API جلد ہی CometAPI پر ظاہر ہوگا، اس لیے دیکھتے رہیں!جب تک ہم Qwen‑VLo ماڈل اپ لوڈ کو حتمی شکل دیتے ہیں، اس پر ہمارے دوسرے ماڈلز کو دریافت کریں۔ ماڈلز کا صفحہ یا میں ان کی کوشش کریں AI کھیل کا میدان. CometAPI میں Qwen کا تازہ ترین ماڈل ہے۔ Qwen 3 API(qwen3-235b-a22b;qwen3-30b-a3b;qwen3-8b)
