گوگل کا جدید ترین آن ڈیوائس AI، Gemma 3n، جدید ترین جنریٹو ماڈلز کو کمپیکٹ، موثر، اور رازداری کے تحفظ کے لیے آگے بڑھنے کی نمائندگی کرتا ہے۔ مئی 2025 کے آخر میں گوگل I/O پر پیش نظارہ میں لانچ کیا گیا، Gemma 3n پہلے سے ہی ڈویلپرز اور محققین میں جوش و خروش پیدا کر رہا ہے کیونکہ یہ اعلی درجے کی ملٹی موڈل AI صلاحیتیں براہ راست موبائل اور ایج ڈیوائسز پر لاتا ہے۔ یہ مضمون تازہ ترین اعلانات، ڈویلپر کی بصیرت، اور آزاد بینچ مارکس کی ترکیب کرتا ہے۔
Gemma 3n کیا ہے؟
Gemma 3n تخلیقی AI ماڈلز کے Google کے Gemma خاندان کا سب سے نیا رکن ہے، جو خاص طور پر ڈیوائس پر وسائل سے محدود ہارڈ ویئر جیسے اسمارٹ فونز، ٹیبلٹس اور ایمبیڈڈ سسٹمز کا اندازہ۔ اس کے پیشروؤں کے برعکس — Gemma 3 اور اس سے پہلے کی مختلف حالتیں، جو بنیادی طور پر کلاؤڈ یا سنگل-GPU استعمال کے لیے موزوں تھیں — Gemma 3n کے فن تعمیر کو ترجیح دی جاتی ہے۔ کم وابستہ, میموری کے اثرات کو کم کرنا، اور متحرک وسائل کا استعمال, صارفین کو مسلسل انٹرنیٹ کنکشن کے بغیر اعلی درجے کی AI خصوصیات چلانے کے قابل بناتا ہے۔
کیوں "3n"؟
Gemma 3n میں "n" کا مطلب ہے "گھوںسلا,” ماڈل کے استعمال کی عکاسی کرتا ہے۔ ماتریوشکا ٹرانسفارمر (یا میٹفارمر) فن تعمیر۔ یہ ڈیزائن چھوٹے ذیلی ماڈلز کو بڑے ماڈل کے اندر گھوںسلا کرتا ہے، جو روسی گھونسلے کی گڑیا کے مشابہ ہے، جس سے کسی مخصوص کام کے لیے درکار اجزاء کو منتخب کرنے کی اجازت ملتی ہے۔ ایسا کرنے سے، Gemma 3n ان ماڈلز کے مقابلے میں کمپیوٹ اور توانائی کی کھپت کو کافی حد تک کم کر سکتا ہے جو ہر درخواست پر تمام پیرامیٹرز کو فعال کرتے ہیں۔
پیش نظارہ ریلیز اور ایکو سسٹم
گوگل نے کھولا۔ Gemma 3n کا پیش نظارہ I/O پر، اسے Google AI اسٹوڈیو، Google GenAI SDK، اور پیش نظارہ لائسنس کے تحت Hugging Face جیسے پلیٹ فارمز پر دستیاب کرانا۔ جب کہ وزن ابھی تک مکمل طور پر اوپن سورس نہیں ہیں، ڈویلپرز براؤزر میں ہدایات کے مطابق مختلف قسموں کے ساتھ تجربہ کر سکتے ہیں یا انہیں APIs کے ذریعے پروٹو ٹائپس میں ضم کر سکتے ہیں جنہیں Google تیزی سے پھیلا رہا ہے۔
Gemma 3n کیسے کام کرتا ہے؟
Gemma 3n کے میکانزم کو سمجھنا اس کی آن ڈیوائس ایپلیکیشنز کے لیے موزوں ہونے کا جائزہ لینے کے لیے بہت ضروری ہے۔ یہاں ہم اس کی تین بنیادی تکنیکی اختراعات کو توڑتے ہیں۔
Matryoshka ٹرانسفارمر (MatFormer) فن تعمیر
Gemma 3n کے دل میں واقع ہے۔ میٹفارمر، ایک ٹرانسفارمر مختلف قسم پر مشتمل ہے۔ گھریلو ذیلی ماڈل مختلف سائز کے. ہلکے وزن والے کاموں کے لیے—کہیں، مختصر اشارے کے ساتھ ٹیکسٹ جنریشن—صرف سب سے چھوٹا ذیلی ماڈل چالو ہوتا ہے، جس میں کم سے کم CPU، میموری اور پاور استعمال ہوتی ہے۔ زیادہ پیچیدہ کاموں کے لیے—جیسے کوڈ جنریشن یا ملٹی موڈل ریجننگ—بڑے "بیرونی" ذیلی ماڈلز کو متحرک طور پر لوڈ کیا جاتا ہے۔ یہ لچک Gemma 3n بناتی ہے۔ کمپیوٹ انکولی, طلب پر وسائل کے استعمال کو پیمانہ کرنا۔
فی پرت ایمبیڈنگ (PLE) کیشنگ
یادداشت کو مزید محفوظ کرنے کے لیے، Gemma 3n کام کرتا ہے۔ PLE کیشنگ، تیز بیرونی یا وقف شدہ اسٹوریج کے لئے شاذ و نادر ہی استعمال شدہ فی پرت ایمبیڈنگز کو آف لوڈ کرنا۔ RAM میں مستقل طور پر رہنے کے بجائے، یہ پیرامیٹرز ہیں۔ پرواز پر لایا تخمینہ کے دوران صرف ضرورت کے وقت. ابتدائی ٹیسٹوں کے مطابق، PLE کیشنگ ہمیشہ بھری ہوئی ایمبیڈنگز کے مقابلے میں چوٹی کے میموری فوٹ پرنٹ کو 40% تک کم کر دیتی ہے۔
مشروط پیرامیٹر لوڈ ہو رہا ہے۔
MatFormer اور PLE کیشنگ سے آگے، Gemma 3n سپورٹ کرتا ہے۔ مشروط پیرامیٹر لوڈنگ. ڈویلپرز پہلے سے وضاحت کر سکتے ہیں کہ ان کی ایپلی کیشن کو کن طریقوں (ٹیکسٹ، ویژن، آڈیو) کی ضرورت ہے۔ Gemma 3n پھر لوڈ کرنا چھوڑ دیتا ہے۔ غیر استعمال شدہ موڈیلٹی مخصوص وزن، RAM کے استعمال کو مزید تراشنا۔ مثال کے طور پر، صرف ٹیکسٹ چیٹ بوٹ وژن اور آڈیو پیرامیٹرز کو بالکل خارج کر سکتا ہے، لوڈنگ کے اوقات کو ہموار کر سکتا ہے اور ایپ کا سائز کم کر سکتا ہے۔
کارکردگی کے معیارات کیا دکھاتے ہیں؟
ابتدائی معیارات Gemma 3n کی رفتار، کارکردگی اور درستگی کے متاثر کن توازن کو نمایاں کرتے ہیں۔
سنگل GPU موازنہ
اگرچہ Gemma 3n کو ایج ڈیوائسز کے لیے ڈیزائن کیا گیا ہے، لیکن یہ اب بھی ایک GPU پر مسابقتی کارکردگی کا مظاہرہ کرتا ہے۔ دی ورج نے رپورٹ کیا کہ Gemma 3 (اس کے بڑے کزن) نے سنگل-GPU سیٹنگز میں LLaMA اور GPT جیسے سرکردہ ماڈلز کو پیچھے چھوڑ دیا، جس نے کارکردگی اور حفاظتی جانچ میں گوگل کی انجینئرنگ کی صلاحیت کو ظاہر کیا۔ جھگڑا. جب کہ Gemma 3n کے لیے مکمل تکنیکی رپورٹس آنے والی ہیں، ابتدائی ٹیسٹوں سے ظاہر ہوتا ہے کہ تھرو پٹ کے فوائد 20-30٪ موازنہ ہارڈ ویئر پر بمقابلہ Gemma 3۔
چیٹ بوٹ ایرینا اسکورز
چیٹ بوٹ ایرینا جیسے پلیٹ فارمز پر آزادانہ جائزے Gemma 3n کے 4 B-پیرامیٹر کی مختلف حالتوں کی تجویز کرتے ہیں۔ outperforms GPT-4.1 مخلوط کاموں میں نینو، بشمول ریاضیاتی استدلال اور گفتگو کا معیار۔ KDnuggets کے اسسٹنٹ ایڈیٹر نے Gemma 3n کی مربوط، سیاق و سباق سے بھرپور مکالمے کو برقرار رکھنے کی صلاحیت کو نوٹ کیا۔ 1.5× بہتر Elo سکور اپنے پیشرو کے مقابلے میں، جواب میں تاخیر کو تقریباً نصف تک کم کرتے ہوئے
آن ڈیوائس تھرو پٹ اور لیٹنسی
جدید فلیگ شپ اسمارٹ فونز پر (مثال کے طور پر، Snapdragon 8 Gen 3، Apple A17)، Gemma 3n حاصل کرتا ہے 5–10 ٹوکن فی سیکنڈ صرف سی پی یو کے تخمینے پر، اسکیل کرنا 20–30 ٹوکن فی سیکنڈ آن ڈیوائس NPUs یا DSPs کا فائدہ اٹھاتے وقت۔ یادداشت کا استعمال عروج پر ہے۔ 2 GB پیچیدہ ملٹی موڈل کاموں کے دوران RAM کی مقدار، زیادہ تر اعلیٰ درجے کے موبائل ہارڈویئر بجٹ میں آرام سے فٹ بیٹھتی ہے۔
Gemma 3n کیا خصوصیات پیش کرتا ہے؟
Gemma 3n کا فیچر سیٹ خام کارکردگی سے بہت آگے بڑھتا ہے، حقیقی دنیا کے قابل اطلاق پر توجہ مرکوز کرتا ہے۔
ملٹی موڈل تفہیم
- متن: ہدایات کے مطابق ٹیکسٹ جنریشن، خلاصہ، ترجمہ اور کوڈ جنریشن کے لیے مکمل تعاون۔
- ویژن: نان اسکوائر اور ہائی ریزولیوشن ان پٹس کے لیے سپورٹ کے ساتھ امیجز کا تجزیہ اور سرخی لگائیں۔
- آڈیو: آن ڈیوائس آٹومیٹک اسپیچ ریکگنیشن (ASR) اور 140+ زبانوں میں اسپیچ ٹو ٹیکسٹ ترجمہ۔
- ویڈیو (جلد آرہا ہے): گوگل نے مستقبل کے Gemma 3n اپ ڈیٹس میں ویڈیو ان پٹ پروسیسنگ کے لیے آئندہ سپورٹ کا اشارہ دیا ہے۔
رازداری-پہلے اور آف لائن-تیار
مکمل طور پر آن ڈیوائس چلانے سے، Gemma 3n یقینی بناتا ہے۔ ڈیٹا کبھی بھی صارف کے ہارڈ ویئر کو نہیں چھوڑتا ہے۔، رازداری کے بڑھتے ہوئے خدشات کو دور کرنا۔ آف لائن تیاری کا مطلب یہ بھی ہے کہ ایپس کم کنیکٹیویٹی والے ماحول میں کارآمد رہیں — فیلڈ ورک، سفر، اور محفوظ انٹرپرائز ایپلی کیشنز کے لیے اہم۔
متحرک وسائل کا استعمال
- منتخب ذیلی ماڈل ایکٹیویشن MatFormer کے ذریعے
- مشروط پیرامیٹر لوڈ ہو رہا ہے۔ غیر استعمال شدہ موڈلٹی وزن کو چھوڑنا
- PLE کیشنگ ایمبیڈنگز کو آف لوڈ کرنے کے لیے
یہ خصوصیات یکجا ہو کر ڈویلپرز کو اپنے وسائل کی پروفائل کو ان کی درست ضروریات کے مطابق ڈھالنے دیتی ہیں — چاہے اس کا مطلب بیٹری کے لیے حساس ایپس کے لیے کم سے کم نقش یا ملٹی میڈیا کاموں کے لیے مکمل فیچر کی تعیناتی ہو۔
کثیر لسانی فضیلت
Gemma 3n کا تربیتی کارپس ختم ہو گیا ہے۔ **140 بولی جانے والی زبانیں۔**خاص طور پر مضبوط کارکردگی کے ساتھ جاپانی، کورین، جرمن، اور ہسپانوی جیسی اعلیٰ اثر والی مارکیٹوں میں رپورٹ کی گئی ہے۔ ابتدائی ٹیسٹ تک ظاہر ہوتے ہیں۔ 2 × غیر انگریزی کاموں میں درستگی میں بہتری بمقابلہ سابقہ آن ڈیوائس ماڈلز۔
حفاظت اور مواد کی فلٹرنگ
Gemma 3n واضح یا پرتشدد مواد کو فلٹر کرنے کے لیے ایک بلٹ ان امیج سیفٹی کلاسیفائر (ShieldGemma 2 کے مشابہ) کو شامل کرتا ہے۔ گوگل کا پرائیویسی فرسٹ ڈیزائن یہ یقینی بناتا ہے کہ یہ فلٹرز مقامی طور پر چلتے ہیں، جس سے ڈویلپرز کو یہ اعتماد ملتا ہے کہ صارف کا تیار کردہ مواد بیرونی API کالز کے بغیر مطابقت رکھتا ہے۔
Gemma 3n کے استعمال کے عام معاملات کیا ہیں؟
آلے کی کارکردگی کے ساتھ ملٹی موڈل صلاحیت کو جوڑ کر، Gemma 3n تمام صنعتوں میں نئی ایپلی کیشنز کو کھولتا ہے۔
کن کنزیومر ایپلی کیشنز سب سے زیادہ فائدہ اٹھاتے ہیں؟
- کیمرے سے چلنے والے معاونین: ریئل ٹائم منظر کی تفصیل یا ترجمہ براہ راست آن ڈیوائس، بغیر کلاؤڈ لیٹنسی کے۔
- وائس فرسٹ انٹرفیس: کاروں یا سمارٹ ہوم ڈیوائسز میں پرائیویٹ، آف لائن اسپیچ اسسٹنٹس۔
- جمع شدہ حقیقت (AR): اے آر شیشوں پر لائیو آبجیکٹ کی شناخت اور کیپشن اوورلے۔
Gemma 3n انٹرپرائز کے منظرناموں میں کیسے استعمال ہوتا ہے؟
- فیلڈ معائنہ: افادیت اور انفراسٹرکچر کے لیے آف لائن معائنہ کے ٹولز، موبائل آلات پر امیج-ٹیکسٹ استدلال کا فائدہ اٹھانا۔
- محفوظ دستاویز پروسیسنگ: مالیات یا صحت کی دیکھ بھال کے شعبوں میں دستاویز کے حساس تجزیے کے لیے آن پریمیس AI، اس بات کو یقینی بنانا کہ ڈیٹا کبھی بھی ڈیوائس سے باہر نہ جائے۔
- بہزبانی سپورٹ: حقیقی وقت میں بین الاقوامی مواصلات کا فوری ترجمہ اور خلاصہ۔
حدود اور تحفظات کیا ہیں؟
اگرچہ یہ ایک بڑے قدم کی نمائندگی کرتا ہے، ڈویلپرز کو موجودہ رکاوٹوں سے آگاہ ہونا چاہیے۔
کون سے تجارتی تعلقات موجود ہیں؟
- معیار بمقابلہ رفتار: لوئر پیرامیٹر کے ذیلی ماڈلز تیز تر رسپانس پیش کرتے ہیں لیکن آؤٹ پٹ فیڈیلیٹی کو قدرے کم کر دیتے ہیں۔ صحیح مرکب کا انتخاب درخواست کی ضروریات پر منحصر ہے۔
- سیاق و سباق ونڈو مینجمنٹ: اگرچہ 128 K ٹوکنز کافی ہیں، لیکن طویل مکالموں یا دستاویز کی وسیع پروسیسنگ کی ضرورت والی ایپلیکیشنز کو اب بھی کلاؤڈ بیسڈ ماڈلز کی ضرورت پڑ سکتی ہے۔
- ہارڈ ویئر مطابقت: NPUs یا جدید GPUs کی کمی والے پرانی آلات میں سست تخمینے کا تجربہ ہو سکتا ہے، جو حقیقی وقت کے استعمال کے معاملات کو محدود کر سکتا ہے۔
ذمہ دار AI کے بارے میں کیا خیال ہے؟
گوگل کی ریلیز کے ساتھ ماڈل کارڈز ہیں جن میں تعصب کی تشخیص، حفاظتی تخفیف، اور نقصان کو کم کرنے اور اخلاقی تعیناتی کو یقینی بنانے کے لیے استعمال کی تجویز کردہ رہنما خطوط کی تفصیل دی گئی ہے۔
نتیجہ
Gemma 3n نے ایک نئے دور کا آغاز کیا۔ آن ڈیوائس جنریٹو AI، حقیقی دنیا کی تعیناتی کی اصلاح کے ساتھ جدید ترین ٹرانسفارمر اختراعات کا امتزاج۔ اس کا میٹفارمر فن تعمیر، PLE کیشنگ، اور مشروط پیرامیٹر لوڈنگ فلیگ شپ فونز سے لے کر ایمبیڈڈ ایج ڈیوائسز تک ہارڈ ویئر پر اعلیٰ معیار کا اندازہ کھولیں۔ ملٹی موڈل صلاحیتوں، پرائیویسی کے مضبوط تحفظات، اور مضبوط ابتدائی بینچ مارکس کے ساتھ ساتھ Google AI اسٹوڈیو، SDKs، اور Hugging Face کے ذریعے آسان رسائی — Gemma 3n ڈویلپرز کو AI سے چلنے والے تجربات کا دوبارہ تصور کرنے کی دعوت دیتا ہے جہاں بھی صارف ہوں۔
چاہے آپ ٹریول کے لیے تیار لینگویج اسسٹنٹ، ایک آف لائن فوٹو کیپشننگ ٹول، یا نجی انٹرپرائز چیٹ بوٹ بنا رہے ہوں، Gemma 3n رازداری کی قربانی کے بغیر آپ کو مطلوبہ کارکردگی اور لچک فراہم کرتا ہے۔ جیسا کہ گوگل اپنے پیش نظارہ پروگرام کو بڑھا رہا ہے اور ویڈیو کو سمجھنے جیسی خصوصیات شامل کرتا جا رہا ہے، اب آپ کے اگلے AI پروجیکٹ کے لیے Gemma 3n کی صلاحیت کو دریافت کرنے کا بہترین وقت ہے۔
شروع
CometAPI ایک متحد REST انٹرفیس فراہم کرتا ہے جو کہ سیکڑوں AI ماڈلز کو جمع کرتا ہے—بشمول Gemini فیملی—ایک مستقل اختتامی نقطہ کے تحت، بلٹ ان API-کی مینجمنٹ، استعمال کوٹہ، اور بلنگ ڈیش بورڈز کے ساتھ۔ متعدد وینڈر یو آر ایل اور اسناد کو جگانے کے بجائے۔
ڈویلپرز رسائی حاصل کر سکتے ہیں۔ جیمنی 2.5 فلیش پری API (ماڈل:gemini-2.5-flash-preview-05-20) اور Gemini 2.5 Pro API (ماڈل:gemini-2.5-pro-preview-05-06) وغیرہ کے ذریعے CometAPI. شروع کرنے کے لیے، میں ماڈل کی صلاحیتوں کو دریافت کریں۔ کھیل کے میدان اور مشورہ کریں API گائیڈ تفصیلی ہدایات کے لیے۔ رسائی کرنے سے پہلے، براہ کرم یقینی بنائیں کہ آپ نے CometAPI میں لاگ ان کیا ہے اور API کلید حاصل کر لی ہے۔
