Cara Mencipta dan mengedit imej dengan pratonton Gemini 2.0 Flash

CometAPI
AnnaMay 9, 2025
Cara Mencipta dan mengedit imej dengan pratonton Gemini 2.0 Flash

Sejak dilancarkan pada 7 Mei 2025, keupayaan imej Gemini 2.0 Flash telah tersedia dalam bentuk pratonton—memperkasakan pembangun dan profesional kreatif untuk menjana dan memperhalusi visual melalui perbualan bahasa semula jadi. Artikel ini mensintesis pengumuman terkini, laporan langsung dan dokumentasi teknikal untuk membimbing anda melalui segala-galanya daripada membuat gesaan imej pertama anda kepada melakukan pengeditan tepat pada aset sedia ada. Setiap tajuk menengah mengemukakan soalan utama untuk mengorientasikan penerokaan anda, dengan tajuk tertiari menguraikan butiran khusus yang anda perlukan untuk mula membina hari ini.

Apakah pratonton Gemini 2.0 Flash untuk penjanaan dan penyuntingan imej?

Gemini 2.0 Flash ialah model AI terbaharu Google yang dioptimumkan untuk kepantasan (“Flash”) dan tugasan pelbagai mod, kini menawarkan penjanaan imej dan pengeditan dalam pratonton melalui Google AI Studio dan Vertex AI. Diumumkan oleh Kat Kampf, Pengurus Produk untuk Google AI Studio pada 7 Mei 2025, pratonton mendedahkan nama model gemini-2.0-flash-preview-image-generation melalui API GenAI, membolehkan kadar permintaan yang lebih tinggi dan penyepaduan yang lancar ke dalam aplikasi . India Today Tech mengesahkan bahawa kedua-dua pengguna percuma (melalui apl Gemini) dan pembangun (melalui AI Studio/Vertex AI) boleh bereksperimen dengan alat yang dinaik taraf ini tanpa sebarang kos—menandakan pendemokrasian AI imej lanjutan yang ketara.

Apakah yang membezakan Gemini 2.0 Flash daripada keluaran penjanaan imej terdahulu?

Berbanding dengan model imej eksperimen yang sebelum ini dibenamkan dalam Gemini, Flash menawarkan:

  • Kesetiaan visual yang dipertingkatkan: Butiran yang lebih tajam, tekstur yang lebih realistik dan pengendalian elemen halus yang lebih baik seperti rambut, dedaunan dan pantulan .
  • Penyampaian teks dipertingkatkan: Letakkan dan gayakan teks dengan tepat dalam imej, mengurangkan huruf berantakan dan glif tidak sejajar yang biasa dalam versi terdahulu.
  • Kadar blok penapis yang lebih rendah: Penapis kandungan santai membolehkan lebih banyak gesaan jinak melalui, sambil masih menguatkuasakan dasar pada bahan yang tidak dibenarkan, memperkemas aliran kerja untuk kes penggunaan yang mematuhi.

Bagaimanakah pembangun boleh menjana imej menggunakan pratonton Gemini 2.0 Flash?

Menjana imej adalah semudah menggunakan GenAI SDK atau REST API dengan gesaan anda dan menyatakan bahawa anda mahukan kedua-dua modaliti teks dan imej.

Gunakan API dalam google:

from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=("Show me an ultra-realistic watercolor painting of a city skyline at sunset"),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
)
print(response.images.url)

Coretan ini menggambarkan persediaan minimum: ganti GEMINI_API_KEY dengan kunci anda, laraskan contents rentetan ke visi kreatif anda dan terima URL ke imej yang dijana.

Gunakan penjanaan imej Gemini 2.0 Flash dalam CometAPI

Apakah amalan terbaik yang mendorong menghasilkan visual berkualiti tinggi?

  1. Jadi khusus tentang gaya dan sederhana: “Lukisan cat air,” “pemandangan siberpunk neon,” atau “seni vektor minimalis” membantu model menambat keluarannya.
  2. Sertakan petunjuk komposisi: Frasa seperti "peraturan pertiga," "pencahayaan dramatik dari kiri," atau "subjek latar depan dalam fokus tajam" pembingkaian panduan.
  3. Ulangi dengan gesaan susulan: Gunakan suntingan perbualan (lihat bahagian seterusnya) untuk menyenggol keseimbangan warna, melaraskan perkadaran atau memperhalusi butiran tanpa bermula dari awal.

Bagaimanakah anda boleh mengedit imej sedia ada secara perbualan?

Pengeditan berfungsi dengan memuat naik imej atau memilih aset yang dijana sebelum ini, kemudian mengeluarkan arahan bahasa semula jadi untuk mengubah kawasan atau atribut tertentu.

response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=(
       "Remove the background from this image, replace it with a snowy mountain vista, and enhance the subject's coat color to deep crimson."
   ),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
   input_image="gs://my-bucket/path/to/source.png"
)

Apakah ciri pengeditan perbualan yang disokong?

  • Suntingan terpilih: Tukar kawasan yang ditetapkan sahaja (cth, “mencerahkan mata,” “tambahkan kaligrafi pada papan tanda”) tanpa menjejaskan piksel sekeliling .
  • Lukisan bersama masa nyata: Melalui Aplikasi Contoh Lukisan Bersama Gemini, berbilang kolaborator boleh melakar dan memberi anotasi terus dalam AI Studio, mempercepatkan aliran kerja berulang.
  • Kontekstualisasi semula: Letakkan produk atau watak ke dalam adegan baharu sepenuhnya—sesuai untuk mockup pemasaran atau prototaip pantas konsep visual.
  • Pembuangan tera air: Pengguna awal melaporkan bahawa Gemini 2.0 Flash boleh menanggalkan tera air yang boleh dilihat dan menggantikannya dengan tanda SynthID neutral, walaupun garis panduan penggunaan etika terpakai.

Gemini 2.0 Flash

Apakah had kadar dan harga yang dikenakan dalam pratonton?

Google telah menarik balik banyak kekangan daripada fasa percubaan: pembangun mendapat manfaat daripada kuota seminit yang lebih tinggi dan kadar pratonton terdiskaun.

Bagaimanakah had kadar telah bertambah baik?

  • Peningkatan QPS: Permintaan sesaat meningkat dua kali ganda berbanding model percubaan sebelumnya, menyokong beban kerja yang meledak dan aplikasi masa nyata.
  • Pengeditan pukal: Gemini kini menerima sehingga 10 imej dalam satu kelompok untuk mengedit, memperkemas aliran kerja yang memerlukan pelarasan gaya yang konsisten merentas berbilang aset.

Apakah rupa harga pratonton?

  • Penjanaan imej: Kira-kira $0.039 setiap imej (3.9 sen), dibilkan setiap output unik .
  • Operasi penyuntingan: Harga sama dengan pekerjaan penjanaan, dengan diskaun lanjut dirancang sebaik sahaja pratonton tamat.

Bagaimanakah anda mengakses dan mengkonfigurasi pratonton hari ini?

  1. Login kepada Google AI Studio atau Vertex AI dalam Google Cloud Console.
  2. Dayakan API GenAI dan buat kunci API di bawah "Kredential".
  3. pilih model itu gemini-2.0-flash-preview-image-generation dalam kod atau panggilan API anda.
  4. Upload imej sumber (jika mengedit) melalui Storan Awan atau terus dalam UI Studio.
  5. sembah gesaan anda dan semak output dalam papan pemuka Studio atau secara pengaturcaraan.

Apakah penambahbaikan masa depan yang boleh kita jangkakan?

Google telah memberi isyarat beberapa peningkatan yang akan datang sebaik sahaja Gemini 2.0 Flash bergerak melangkaui pratonton:

Keupayaan yang diperluaskan

  • Output resolusi yang lebih tinggi (sehingga 4K+), sesuai untuk paparan cetakan dan berskala besar.
  • Pengadunan gaya lanjutan, menggabungkan berbilang rujukan artistik dalam satu imej.

Penyepaduan yang lebih luas

  • Sokongan asli dalam Chrome, Dokumen, Slaid, dan aplikasi G Suite lain, mendayakan penciptaan dan pengeditan imej satu klik.
  • Ejen multimodal yang dipertingkatkan (Projek Astra), menyepadukan tugas imej ke dalam perbualan yang lebih panjang dan sedar konteks.

Dengan mendayakan penjanaan imej dan pengeditan tepat melalui antara muka perbualan yang intuitif, pratonton Gemini 2.0 Flash menandakan kejayaan dalam kreativiti dikuasakan AI yang boleh diakses dan boleh skala. Sama ada anda membuat prototaip visual produk, bekerjasama dalam aset pemasaran atau hanya meneroka ufuk artistik baharu, pratonton memberi anda alatan untuk mengulang lebih pantas dan lebih kaya berbanding sebelum ini. Apabila pratonton berkembang menjadi keluaran penuh, harapkan penyepaduan yang lebih mendalam merentas ekosistem Google dan keupayaan yang lebih canggih untuk memacu kejayaan anda yang seterusnya.

Bermula

Pembangun boleh mengakses  API Penjanaan Imej Eksp Flash Gemini 2.0 melalui CometAPI. Untuk bermula, terokai keupayaan model di Taman Permainan dan rujuk Panduan API (nama model: gemini-2.0-flash-exp-image-generation) untuk arahan terperinci. Harap maklum bahawa sesetengah pembangun mungkin perlu mengesahkan organisasi mereka sebelum menggunakan model tersebut. API pra-Penjanaan Imej Gemini 2.0 Flash akan dilancarkan tidak lama lagi.

SHARE THIS BLOG

500+ Model dalam Satu API

Sehingga 20% Diskaun