Slik lager og redigerer du bilder med Gemini 2.0 Flash-forhåndsvisning

Siden avdukingen 7. mai 2025 har bildefunksjonene i Gemini 2.0 Flash vært tilgjengelige i forhåndsvisningsformat – noe som gir utviklere og kreative fagfolk muligheten til å generere og forbedre visuelle elementer gjennom samtaler i naturlig språk. Denne artikkelen sammenfatter de siste kunngjøringene, praktiske rapportene og den tekniske dokumentasjonen for å veilede deg gjennom alt fra å lage din første bildeprompt til å utføre presise redigeringer på eksisterende ressurser. Hver sekundæroverskrift stiller et nøkkelspørsmål for å orientere utforskningen din, med tertiære overskrifter som bryter ned detaljene du trenger for å begynne å bygge i dag.

Hva er Gemini 2.0 Flash-forhåndsvisningen for bildegenerering og -redigering?

Gemini 2.0 Flash er Googles nyeste AI-modell optimalisert for hastighet («Flash») og multimodale oppgaver, og tilbyr nå bildegenerering og -redigering i forhåndsvisning via Google AI Studio og Vertex AI. Forhåndsvisningen, som ble annonsert av Kat Kampf, produktsjef for Google AI Studio, 7. mai 2025, avslører modellnavnet. gemini-2.0-flash-preview-image-generation gjennom GenAI API, noe som muliggjør høyere forespørselsrater og sømløs integrering i applikasjoner. India Today Tech bekrefter at både gratisbrukere (gjennom Gemini-appen) og utviklere (via AI Studio/Vertex AI) kan eksperimentere med disse oppgraderte verktøyene uten kostnad – noe som markerer en betydelig demokratisering av avansert bilde-AI.

Hva skiller Gemini 2.0 Flash fra tidligere utgivelser av bildegenerering?

Sammenlignet med den eksperimentelle bildemodellen som tidligere var innebygd i Gemini, tilbyr Flash:

Forbedret visuell gjengivelseSkarpere detaljer, mer realistiske teksturer og bedre håndtering av fine elementer som hår, løvverk og refleksjoner.
Forbedret tekstgjengivelsePlasserer og formaterer tekst nøyaktig i bilder, og reduserer uklare bokstaver og feiljusterte tegn som er vanlige i tidligere versjoner.
Lavere filterblokkeringsraterAvslappede innholdsfiltre slipper gjennom mer godartede forespørsler, samtidig som de håndhever retningslinjene for ikke-tillatt materiale, og effektiviserer arbeidsflyter for kompatible brukstilfeller.

Hvordan kan utviklere generere bilder ved hjelp av Gemini 2.0 Flash-forhåndsvisning?

Å generere bilder er så enkelt som å kalle GenAI SDK eller REST API med ledeteksten din og spesifisere at du ønsker både tekst- og bildemodaliteter.

Bruk API-et i Google:

from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=("Show me an ultra-realistic watercolor painting of a city skyline at sunset"),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
)
print(response.images.url)

Dette utdraget illustrerer det minimale oppsettet: erstatt GEMINI_API_KEY med nøkkelen din, juster contents streng til din kreative visjon, og motta en URL til det genererte bildet.

Bruk Gemini 2.0 Flash-bildegenerering i CometAPI

Hvilke beste fremgangsmåter gir visuelle effekter av høyest kvalitet?

Vær spesifikk om stil og medium«Akvarellmaleri», «neon cyberpunk-scene» eller «minimalistisk vektorkunst» hjelper modellen med å forankre resultatet.
Inkluder komposisjonstipsFraser som «tredjedelsregel», «dramatisk belysning fra venstre» eller «forgrunnsmotiv i skarpt fokus» styrer komposisjonen.
Iterer med oppfølgingsspørsmålBruk samtaleredigeringer (se neste avsnitt) for å justere fargebalansen, justere proporsjoner eller forbedre detaljer uten å starte fra bunnen av.

Hvordan kan du redigere eksisterende bilder konversasjonsmessig?

Redigering fungerer ved å laste opp et bilde eller velge et tidligere generert element, og deretter gi instruksjoner på naturlig språk for å endre bestemte områder eller attributter.

response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=(
       "Remove the background from this image, replace it with a snowy mountain vista, and enhance the subject's coat color to deep crimson."
   ),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
   input_image="gs://my-bucket/path/to/source.png"
)

Hvilke funksjoner for redigering av samtaler støttes?

Selektive redigeringerEndre bare angitte områder (f.eks. «lys opp øynene», «legg til kalligrafi på skiltingen») uten å påvirke omkringliggende piksler.
Samtegning i sanntidGjennom Gemini Co-Drawing Sample App kan flere samarbeidspartnere skissere og annotere direkte i AI Studio, noe som akselererer iterative arbeidsflyter.
RekontekstualiseringPlasser produkter eller karakterer i helt nye scener – ideelt for markedsføringsmodeller eller rask prototyping av visuelle konsepter.
Fjerning av vannmerkeTidlige brukere rapporterer at Gemini 2.0 Flash kan fjerne synlige vannmerker og erstatte dem med et nøytralt SynthID-merke, selv om etiske retningslinjer for bruk gjelder.

Gemini 2.0 Flash

Hvilke prisgrenser og priser gjelder i forhåndsvisningen?

Google har fjernet mange begrensninger fra forsøksfasen: utviklere drar nytte av høyere kvoter per minutt og rabatterte forhåndsvisningspriser.

Hvordan har rentegrensene blitt forbedret?

Økt QPSForespørsler per sekund doblet seg sammenlignet med den forrige eksperimentelle modellen, som støtter bursty-arbeidsbelastninger og sanntidsapplikasjoner.
BulkredigeringGemini godtar nå opptil 10 bilder i én omgang for redigering, noe som effektiviserer arbeidsflyter som krever konsistente stiljusteringer på tvers av flere ressurser.

Hvordan ser forhåndsvisningsprisene ut?

BildegenereringOmtrent 0.039 dollar per bilde (3.9 cent), fakturert per unik utdata.
RedigeringsoperasjonerPriset er tilsvarende generasjonsjobber, med ytterligere rabatter planlagt når forhåndsvisningen er avsluttet.

Hvordan får du tilgang til og konfigurerer forhåndsvisningen i dag?

Logg inn til Google AI Studio eller Vertex AI i Google Cloud Console.
Aktiver GenAI API-et og opprett en API-nøkkel under «Legitimasjonsinformasjon».
Velg modellen gemini-2.0-flash-preview-image-generation i koden din eller API-kall.
Last opp kildebilder (hvis du redigerer) via Cloud Storage eller direkte i Studio-grensesnittet.
påberope dine ledetekster og gjennomgå resultater i Studio-dashbordet eller programmatisk.

Hvilke fremtidige forbedringer kan vi forvente?

Google har signalisert flere kommende forbedringer når Gemini 2.0 Flash går utover forhåndsvisning:

Utvidede muligheter

Høyere oppløsningsutganger (opptil 4K+), ideell for trykk og store skjermer.
Avansert stilblanding, som kombinerer flere kunstneriske referanser i ett enkelt bilde.

Bredere integrasjon

Innebygd støtte i Chrome, Dokumenter og Presentasjonerog andre G Suite-applikasjoner, som muliggjør oppretting og redigering av bilder med ett klikk.
Forbedrede multimodale agenter (Prosjekt Astra), integrering av bildeoppgaver i lengre, kontekstbevisste samtaler.

Ved å muliggjøre både bildegenerering og presise redigeringer via et intuitivt samtalegrensesnitt, markerer forhåndsvisningen av Gemini 2.0 Flash en milepæl innen tilgjengelig, skalerbar AI-drevet kreativitet. Enten du prototyper produktvisualer, samarbeider om markedsføringsressurser eller bare utforsker nye kunstneriske horisonter, gir forhåndsvisningen deg verktøyene til å iterere raskere og rikere enn noen gang før. Etter hvert som forhåndsvisningen utvikler seg til full utgivelse, kan du forvente enda dypere integrering på tvers av Googles økosystem og stadig mer sofistikerte funksjoner for å drive ditt neste gjennombrudd.

Komme i gang

Utviklere har tilgang Gemini 2.0 Flash Exp-Image-Generation API gjennom CometAPI. For å begynne, utforske modellens muligheter i lekeplassen og konsulter API-veiledning (modellnavn: gemini-2.0-flash-exp-image-generation) for detaljerte instruksjoner. Merk at noen utviklere kanskje må bekrefte organisasjonen sin før de bruker modellen. Gemini 2.0 Flash pre-Image-Generation API lanseres snart.