Gemini 2.0 Flash önizlemesi ile resimler nasıl oluşturulur ve düzenlenir

CometAPI
AnnaMay 9, 2025
Gemini 2.0 Flash önizlemesi ile resimler nasıl oluşturulur ve düzenlenir

7 Mayıs 2025'te duyurulmasından bu yana, Gemini 2.0 Flash'ın görüntü yetenekleri önizleme biçiminde mevcuttu; geliştiricilerin ve yaratıcı profesyonellerin doğal dil konuşmaları aracılığıyla görseller üretmesini ve iyileştirmesini sağlıyor. Bu makale, ilk görüntü isteminizi oluşturmaktan mevcut varlıklarda hassas düzenlemeler yapmaya kadar her şeyde size rehberlik etmek için en son duyuruları, uygulamalı raporları ve teknik belgeleri bir araya getiriyor. Her ikincil başlık, keşfinizi yönlendirmek için önemli bir soru ortaya koyarken, üçüncül başlıklar bugün oluşturmaya başlamanız gereken ayrıntıları açıklıyor.

Gemini 2.0 Flash önizlemesi görüntü oluşturma ve düzenleme için nedir?

Gemini 2.0 Flash, Google'ın hız ("Flash") ve çok modlu görevler için optimize edilmiş en son AI modelidir ve artık Google AI Studio ve Vertex AI aracılığıyla önizlemede görüntü oluşturma ve düzenleme olanağı sunar. Google AI Studio Ürün Müdürü Kat Kampf tarafından 7 Mayıs 2025'te duyurulan önizleme, model adını ortaya çıkarır gemini-2.0-flash-preview-image-generation GenAI API aracılığıyla, daha yüksek istek oranları ve uygulamalara sorunsuz entegrasyon sağlıyor. India Today Tech, hem ücretsiz kullanıcıların (Gemini uygulaması aracılığıyla) hem de geliştiricilerin (AI Studio/Vertex AI aracılığıyla) bu yükseltilmiş araçları ücretsiz olarak deneyebileceğini doğruladı; bu da gelişmiş görüntü AI'sının önemli ölçüde demokratikleştiğini gösteriyor.

Gemini 2.0 Flash'ı önceki görüntü oluşturma sürümlerinden ayıran özellikler nelerdir?

Gemini'ye daha önce yerleştirilen deneysel görüntü modeliyle karşılaştırıldığında Flash şunları sunuyor:

  • Geliştirilmiş görsel doğruluk: Daha keskin detaylar, daha gerçekçi dokular ve saç, yeşillik ve yansımalar gibi ince unsurların daha iyi işlenmesi.
  • Geliştirilmiş metin oluşturma: Önceki sürümlerde yaygın olan bozuk harfleri ve hizasız şekilleri azaltarak, metinleri resimlerin içine doğru şekilde yerleştirir ve biçimlendirir.
  • Daha düşük filtre-blok oranları: Rahatlatılmış içerik filtreleri, izin verilmeyen materyaller üzerindeki politikaları uygulamaya devam ederken daha zararsız istemlerin geçmesine izin verir ve uyumlu kullanım durumları için iş akışlarını kolaylaştırır.

Geliştiriciler Gemini 2.0 Flash önizlemesini kullanarak nasıl görsel oluşturabilirler?

Görüntü oluşturmak, GenAI SDK'sını veya REST API'sini komut isteminizle çağırmak ve hem metin hem de görüntü biçimlerini istediğinizi belirtmek kadar basittir.

Google'da API'yi kullanın:

from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=("Show me an ultra-realistic watercolor painting of a city skyline at sunset"),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
)
print(response.images.url)

Bu kod parçası asgari kurulumu göstermektedir: değiştirin GEMINI_API_KEY anahtarınızla ayarlayın contents Yaratıcı vizyonunuza uygun bir bağlantı oluşturun ve oluşturulan görselin URL'sini alın.

CometAPI'de Gemini 2.0 Flash görüntü oluşturmayı kullanın

Hangi teşvik edici en iyi uygulamalar en yüksek kalitede görseller elde etmenizi sağlar?

  1. Stil ve ortam konusunda spesifik olun: "Suluboya resim", "neon siberpunk sahnesi" veya "minimalist vektör sanatı" modelin çıktısını sabitlemeye yardımcı olur.
  2. Kompozisyonel ipuçları ekleyin:“Üçte bir kuralı”, “soldan dramatik aydınlatma” veya “ön plandaki nesnenin net bir şekilde odaklanması” gibi ifadeler kadrajlamaya rehberlik eder.
  3. Takip istemleriyle yineleyin: Renk dengesini iyileştirmek, oranları ayarlamak veya ayrıntıları en baştan başlamak zorunda kalmadan geliştirmek için konuşma tarzındaki düzenlemeleri kullanın (bir sonraki bölüme bakın).

Mevcut görselleri sohbet tarzında nasıl düzenleyebilirsiniz?

Bir resim yükleyerek veya daha önceden oluşturulmuş bir varlığı seçerek eserleri düzenlemek, ardından belirli alanları veya nitelikleri değiştirmek için doğal dil talimatları vermek.

response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=(
       "Remove the background from this image, replace it with a snowy mountain vista, and enhance the subject's coat color to deep crimson."
   ),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
   input_image="gs://my-bucket/path/to/source.png"
)

Hangi konuşma düzenleme özellikleri destekleniyor?

  • Seçici düzenlemeler: Çevredeki pikselleri etkilemeden yalnızca belirlenmiş bölgeleri değiştirin (örneğin, "gözleri aydınlat", "işaret levhasına kaligrafi ekle").
  • Gerçek zamanlı ortak çizim: Gemini Co-Drawing Örnek Uygulaması sayesinde, birden fazla iş birlikçi doğrudan AI Studio'da çizim yapabilir ve açıklamalar ekleyebilir, böylece yinelemeli iş akışları hızlandırılabilir.
  • yeniden bağlamsallaştırma: Ürünleri veya karakterleri tamamen yeni sahnelere yerleştirin; pazarlama maketleri veya görsel konseptlerin hızlı prototiplenmesi için idealdir.
  • Filigran kaldırma:İlk kullanıcılar, Gemini 2.0 Flash'ın görünür filigranları kaldırıp bunları nötr bir SynthID işaretiyle değiştirebildiğini bildiriyor, ancak etik kullanım yönergeleri geçerli.

İkizler 2.0 Flaş

Önizlemede hangi oran sınırları ve fiyatlandırmalar geçerlidir?

Google, deneysel aşamadaki birçok kısıtlamayı kaldırdı: Geliştiriciler, daha yüksek dakika başına kotalardan ve indirimli önizleme oranlarından yararlanıyor.

Faiz oranları nasıl iyileştirildi?

  • Arttırılmış QPS: Önceki deneysel modele kıyasla saniye başına istek sayısı iki katına çıktı, bu da ani iş yüklerini ve gerçek zamanlı uygulamaları destekledi.
  • Toplu düzenleme: Gemini artık tek bir toplu işlemde düzenleme için 10 adede kadar görseli kabul ediyor ve bu sayede birden fazla varlıkta tutarlı stil ayarlamaları gerektiren iş akışları kolaylaştırılıyor.

Önizleme fiyatlandırması nasıl görünüyor?

  • Görüntü oluşturma: Yaklaşık olarak görüntü başına 0.039 ABD Doları (3.9 sent), benzersiz çıktı başına faturalandırılır.
  • İşlemleri düzenleme:Nesil işlerine benzer şekilde fiyatlandırıldı, ancak önizleme tamamlandıktan sonra daha fazla indirim planlanıyor.

Bugün önizlemeye nasıl erişebilir ve onu nasıl yapılandırabilirsiniz?

  1. Oturum aç Google AI Studio'ya veya Google Cloud Console'daki Vertex AI'ya.
  2. GenAI API'yi etkinleştirin ve “Kimlik Bilgileri” altında bir API anahtarı oluşturun.
  3. Seç model gemini-2.0-flash-preview-image-generation Kodunuzda veya API çağrılarınızda.
  4. Foto Yükle Kaynak görüntüleri (düzenleme yapılıyorsa) Cloud Storage üzerinden veya doğrudan Studio kullanıcı arayüzünde.
  5. çağırmak İstemlerinizi ve inceleme çıktılarınızı Studio panosunda veya programlı olarak görüntüleyin.

Gelecekte ne gibi gelişmeler bekleyebiliriz?

Google, Gemini 2.0 Flash önizlemenin ötesine geçtiğinde birkaç yeniliğin geleceğini duyurdu:

Genişletilmiş yetenekler

  • Daha yüksek çözünürlüklü çıktılar (4K+'ya kadar), baskı ve büyük ölçekli gösterimler için idealdir.
  • Gelişmiş stil harmanlama, birden fazla sanatsal referansı tek bir görüntüde birleştiriyor.

Daha geniş entegrasyon

  • Chrome, Docs, Slides'da yerel destekve diğer G Suite uygulamalarıyla tek tıklamayla görüntü oluşturma ve düzenleme olanağı sağlar.
  • Gelişmiş çok modlu acenteler (Proje Astra), görüntü görevlerini daha uzun, bağlam farkında konuşmalara entegre ediyor.

Hem görüntü oluşturmayı hem de sezgisel bir konuşma arayüzü aracılığıyla hassas düzenlemeleri etkinleştirerek, Gemini 2.0 Flash'ın önizlemesi erişilebilir, ölçeklenebilir AI destekli yaratıcılıkta bir dönüm noktasını işaret ediyor. Ürün görselleri prototipliyor, pazarlama varlıkları üzerinde iş birliği yapıyor veya sadece yeni sanatsal ufukları keşfediyor olun, önizleme size her zamankinden daha hızlı ve daha zengin yineleme araçları sunar. Önizleme tam sürüme doğru evrilirken, Google'ın ekosistemi genelinde daha da derin bir entegrasyon ve bir sonraki atılımınızı destekleyecek daha da gelişmiş yetenekler bekleyin.

Başlamak

Geliştiriciler erişebilir  Gemini 2.0 Flash Exp-Görüntü-Oluşturma API'si içinden Kuyrukluyıldız API'siBaşlamak için, Oyun Alanında modelin yeteneklerini keşfedin ve danışın API kılavuzu (model adı: gemini-2.0-flash-exp-image-generation) ayrıntılı talimatlar için. Bazı geliştiricilerin modeli kullanmadan önce kuruluşlarını doğrulamaları gerekebileceğini unutmayın. Gemini 2.0 Flash ön-Görüntü-Oluşturma API'si yakında başlatılacak.

SHARE THIS BLOG

500+ Model Tek Bir API'de

%20'ye Varan İndirim