جیمنی 2.0 فلیش پیش نظارہ کے ساتھ تصاویر کیسے بنائیں اور ان میں ترمیم کریں۔

CometAPI
AnnaMay 9, 2025
جیمنی 2.0 فلیش پیش نظارہ کے ساتھ تصاویر کیسے بنائیں اور ان میں ترمیم کریں۔

7 مئی 2025 کو اس کی نقاب کشائی کے بعد سے، Gemini 2.0 Flash کی تصویری صلاحیتیں پیش نظارہ کی شکل میں دستیاب ہیں — قدرتی زبان میں گفتگو کے ذریعے بصری تخلیق اور بہتر بنانے کے لیے ڈویلپرز اور تخلیقی پیشہ ور افراد کو بااختیار بنانا۔ یہ مضمون تازہ ترین اعلانات، ہینڈ آن رپورٹس، اور تکنیکی دستاویزات کی ترکیب کرتا ہے تاکہ آپ کے پہلے امیج پرامپٹ کو تیار کرنے سے لے کر موجودہ اثاثوں میں درست ترمیم کرنے تک ہر چیز میں آپ کی رہنمائی کی جا سکے۔ ہر ثانوی سرخی آپ کی تلاش کی سمت کے لیے ایک اہم سوال پیدا کرتی ہے، تیسرے درجے کی سرخی ان تفصیلات کو توڑ دیتی ہے جن کی آپ کو آج تعمیر شروع کرنے کی ضرورت ہے۔

امیج جنریشن اور ایڈیٹنگ کے لیے جیمنی 2.0 فلیش کا پیش نظارہ کیا ہے؟

Gemini 2.0 Flash گوگل کا جدید ترین AI ماڈل ہے جو رفتار ("Flash") اور ملٹی موڈل کاموں کے لیے موزوں ہے، جو اب Google AI Studio اور Vertex AI کے ذریعے پیش نظارہ میں تصویر بنانے اور ترمیم کرنے کی پیشکش کرتا ہے۔ 7 مئی 2025 کو گوگل اے آئی اسٹوڈیو کے پروڈکٹ مینیجر کیٹ کیمپف کے ذریعہ اعلان کیا گیا، پیش نظارہ ماڈل کے نام کو بے نقاب کرتا ہے۔ gemini-2.0-flash-preview-image-generation GenAI API کے ذریعے، درخواست کی اعلی شرحوں اور ایپلی کیشنز میں ہموار انضمام کو فعال کرنا۔ انڈیا ٹوڈے ٹیک اس بات کی تصدیق کرتا ہے کہ مفت صارفین (جیمنی ایپ کے ذریعے) اور ڈویلپرز (بذریعہ AI اسٹوڈیو/ورٹیکس AI) بغیر کسی قیمت کے ان اپ گریڈ شدہ ٹولز کے ساتھ تجربہ کر سکتے ہیں۔

جیمنی 2.0 فلیش کو پہلے کی امیج جنریشن ریلیز سے کیا فرق ہے؟

تجرباتی تصویری ماڈل کے مقابلے میں جو پہلے جیمنی میں سرایت کرتا ہے، فلیش پیش کرتا ہے:

  • بہتر بصری وفاداری: تیز تفصیلات، زیادہ حقیقت پسندانہ ساخت، اور عمدہ عناصر جیسے بالوں، پودوں اور عکاسیوں کی بہتر ہینڈلنگ۔
  • بہتر ٹیکسٹ رینڈرنگ: درست طریقے سے تصاویر کے اندر متن کی جگہیں اور سٹائلز، پہلے کے ورژن میں عام طور پر غلط خطوط اور غلط خطوط کو کم کرنا۔
  • فلٹر بلاک ریٹ کم کریں۔: آرام دہ مواد کے فلٹرز مزید بے نظیر اشارے فراہم کرتے ہیں، جبکہ اب بھی نامنظور مواد پر پالیسی کو نافذ کرتے ہوئے، تعمیل شدہ استعمال کے معاملات کے لیے ورک فلو کو ہموار کرتے ہیں۔

ڈویلپرز جیمنی 2.0 فلیش کا پیش نظارہ استعمال کرتے ہوئے تصاویر کیسے بنا سکتے ہیں؟

تصاویر بنانا اتنا ہی آسان ہے جتنا کہ آپ کے پرامپٹ کے ساتھ GenAI SDK یا REST API کو استعمال کرنا اور یہ بتانا کہ آپ متن اور تصویر دونوں طریقوں کو چاہتے ہیں۔

گوگل میں API کا استعمال کریں:

from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=("Show me an ultra-realistic watercolor painting of a city skyline at sunset"),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
)
print(response.images.url)

یہ ٹکڑا کم سے کم سیٹ اپ کی وضاحت کرتا ہے: تبدیل کریں۔ GEMINI_API_KEY اپنی کلید کے ساتھ، ایڈجسٹ کریں۔ contents اپنے تخلیقی نقطہ نظر کو مضبوط کریں، اور تیار کردہ تصویر کا URL حاصل کریں۔

CometAPI میں Gemini 2.0 فلیش امیج جنریشن کا استعمال کریں۔

کون سے پرعزم بہترین طریقوں سے اعلیٰ معیار کے بصری حاصل ہوتے ہیں؟

  1. سٹائل اور میڈیم کے بارے میں مخصوص رہیں: "واٹر کلر پینٹنگ،" "نیون سائبرپنک سین،" یا "کم سے کم ویکٹر آرٹ" ماڈل کو اس کے آؤٹ پٹ کو اینکر کرنے میں مدد کرتا ہے۔
  2. ساختی اشارے شامل کریں۔: جملے جیسے "تہائی کی حکمرانی"، "بائیں سے ڈرامائی روشنی،" یا "تیز فوکس میں پیش منظر کا موضوع" گائیڈ فریمنگ۔
  3. فالو اپ پرامپٹس کے ساتھ اعادہ کریں۔: رنگین توازن کو دھکیلنے، تناسب کو ایڈجسٹ کرنے، یا شروع سے شروع کیے بغیر تفصیلات کو بہتر کرنے کے لیے بات چیت کی ترامیم (اگلا حصہ دیکھیں) کا استعمال کریں۔

آپ موجودہ امیجز کو گفتگو سے کیسے ایڈٹ کر سکتے ہیں؟

ترمیم ایک تصویر کو اپ لوڈ کرکے یا پہلے سے تیار کردہ اثاثہ کو منتخب کرکے، پھر مخصوص علاقوں یا صفات کو تبدیل کرنے کے لیے قدرتی زبان کی ہدایات جاری کرکے کام کرتی ہے۔

response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=(
       "Remove the background from this image, replace it with a snowy mountain vista, and enhance the subject's coat color to deep crimson."
   ),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
   input_image="gs://my-bucket/path/to/source.png"
)

کن بات چیت میں ترمیم کی خصوصیات معاون ہیں؟

  • منتخب ترامیم: ارد گرد کے پکسلز کو متاثر کیے بغیر صرف نامزد خطوں کو تبدیل کریں (مثال کے طور پر، "آنکھوں کو روشن کریں،" "سائن پوسٹ میں خطاطی شامل کریں")۔
  • ریئل ٹائم کو ڈرائنگ: جیمنی کو ڈرائنگ سیمپل ایپ کے ذریعے، متعدد ساتھی AI اسٹوڈیو میں براہ راست خاکہ بنا سکتے ہیں اور تشریح کر سکتے ہیں، تکراری ورک فلو کو تیز کر سکتے ہیں۔
  • ری سیاق و سباق: پروڈکٹس یا کرداروں کو مکمل طور پر نئے مناظر میں رکھیں—مارکیٹنگ موک اپس یا بصری تصورات کی تیز رفتار پروٹو ٹائپنگ کے لیے مثالی۔
  • واٹر مارک ہٹانا: ابتدائی اختیار کرنے والے رپورٹ کرتے ہیں کہ Gemini 2.0 Flash دکھائی دینے والے واٹر مارکس کو ہٹا سکتا ہے اور انہیں غیر جانبدار SynthID نشان سے بدل سکتا ہے، حالانکہ اخلاقی استعمال کے رہنما اصول لاگو ہوتے ہیں۔

جیمنی 2.0 فلیش

پیش نظارہ میں کیا شرح کی حدود اور قیمتوں کا اطلاق ہوتا ہے؟

Google نے تجرباتی مرحلے سے بہت سی رکاوٹوں کو ہٹا دیا ہے: ڈویلپرز فی منٹ کے اعلی کوٹے اور رعایتی پیش نظارہ شرحوں سے فائدہ اٹھاتے ہیں۔

شرح کی حدود میں کیسے بہتری آئی ہے؟

  • QPS میں اضافہ: پچھلے تجرباتی ماڈل کے مقابلے فی سیکنڈ کی درخواستیں دگنی ہوگئیں، کام کے بوجھ اور ریئل ٹائم ایپلی کیشنز کو سپورٹ کرتی ہیں۔
  • بلک ترمیم: جیمنی اب ایک ہی بیچ میں 10 تک تصاویر کو ایڈٹ کرنے، ورک فلو کو ہموار کرنے کے لیے قبول کرتا ہے جس کے لیے متعدد اثاثوں میں مستقل انداز میں ایڈجسٹمنٹ کی ضرورت ہوتی ہے۔

پیش نظارہ کی قیمتوں کا تعین کیسا لگتا ہے؟

  • تصویر کی نسل: تقریباً $0.039 فی تصویر (3.9 سینٹ)، فی منفرد آؤٹ پٹ کا بل۔
  • ترمیم کی کارروائیوں: پیش نظارہ ختم ہونے کے بعد مزید رعایتوں کی منصوبہ بندی کے ساتھ جنریشن جابز کی طرح قیمت۔

آج آپ پیش نظارہ تک کیسے رسائی اور ترتیب دیتے ہیں؟

  1. داخلہ گوگل کلاؤڈ کنسول میں گوگل اے آئی اسٹوڈیو یا ورٹیکس اے آئی کو۔
  2. GenAI API کو فعال کریں۔ اور " اسناد" کے تحت ایک API کلید بنائیں۔
  3. منتخب کریں نمونہ gemini-2.0-flash-preview-image-generation آپ کے کوڈ یا API کالز میں۔
  4. اپ لوڈ کریں کلاؤڈ اسٹوریج کے ذریعے یا براہ راست اسٹوڈیو UI میں ماخذ کی تصاویر (اگر ترمیم کر رہے ہوں)۔
  5. طلب کریں۔ اسٹوڈیو ڈیش بورڈ میں یا پروگرام کے لحاظ سے آپ کے اشارے اور آؤٹ پٹس کا جائزہ لیں۔

ہم مستقبل میں کیا بہتری کی توقع کر سکتے ہیں؟

جیمنی 2.0 فلیش کے پیش نظارہ سے آگے بڑھنے کے بعد گوگل نے کئی آنے والے اضافہ کا اشارہ دیا ہے:

توسیعی صلاحیتیں۔

  • اعلی ریزولوشن آؤٹ پٹ (4K+ تک)، پرنٹ اور بڑے پیمانے پر ڈسپلے کے لیے مثالی۔
  • اعلی درجے کی طرز کی ملاوٹایک تصویر میں متعدد فنکارانہ حوالوں کو یکجا کرنا۔

وسیع تر انضمام

  • Chrome، Docs، Slides میں مقامی تعاون، اور دیگر G Suite ایپلیکیشنز، ایک کلک کی تصویر بنانے اور ترمیم کرنے کو فعال کرتی ہیں۔
  • بہتر ملٹی موڈل ایجنٹس (پروجیکٹ Astra)، تصویری کاموں کو طویل، سیاق و سباق سے آگاہ گفتگو میں ضم کرنا۔

ایک بدیہی بات چیت کے انٹرفیس کے ذریعے تصویر بنانے اور درست ترمیم دونوں کو فعال کرکے، Gemini 2.0 Flash کا پیش نظارہ قابل رسائی، قابل توسیع AI سے چلنے والی تخلیقی صلاحیتوں میں ایک سنگ میل کی نشاندہی کرتا ہے۔ چاہے آپ پروڈکٹ ویژول کی پروٹو ٹائپنگ کر رہے ہوں، مارکیٹنگ کے اثاثوں میں تعاون کر رہے ہوں، یا محض نئے فنکارانہ افق کو تلاش کر رہے ہوں، پیش نظارہ آپ کو پہلے سے کہیں زیادہ تیز اور بھرپور اعادہ کرنے کے لیے ٹولز فراہم کرتا ہے۔ جیسا کہ پیش نظارہ مکمل ریلیز میں تیار ہوتا ہے، گوگل کے ماحولیاتی نظام میں اور بھی گہرے انضمام کی توقع کریں اور آپ کی اگلی پیش رفت کو تقویت دینے کے لیے پہلے سے زیادہ نفیس صلاحیتوں کی توقع کریں۔

شروع

ڈویلپرز رسائی حاصل کر سکتے ہیں۔  Gemini 2.0 Flash Exp-Image-generation API کے ذریعے CometAPI. شروع کرنے کے لیے، کھیل کے میدان میں ماڈل کی صلاحیتوں کو دریافت کریں اور اس سے مشورہ کریں۔ API گائیڈ (ماڈل کا نام: gemini-2.0-flash-exp-image-generation) تفصیلی ہدایات کے لیے۔ نوٹ کریں کہ کچھ ڈویلپرز کو ماڈل استعمال کرنے سے پہلے اپنی تنظیم کی تصدیق کرنے کی ضرورت پڑ سکتی ہے۔ جیمنی 2.0 فلیش پری امیج جنریشن API جلد ہی لانچ کیا جائے گا۔

SHARE THIS BLOG

مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ