Sådan opretter og redigerer du billeder med Gemini 2.0 Flash preview

Siden lanceringen den 7. maj 2025 har Gemini 2.0 Flashs billedfunktioner været tilgængelige i forhåndsvisningsformat – hvilket giver både udviklere og kreative fagfolk mulighed for at generere og forfine visuelle elementer gennem samtaler i naturligt sprog. Denne artikel sammenfatter de seneste annonceringer, praktiske rapporter og teknisk dokumentation, der guider dig gennem alt fra at lave din første billedprompt til at udføre præcise redigeringer på eksisterende aktiver. Hver sekundær overskrift stiller et nøglespørgsmål for at orientere din udforskning, mens tertiære overskrifter opdeler de specifikke detaljer, du har brug for for at begynde at bygge i dag.

Hvad er Gemini 2.0 Flash-forhåndsvisningen til billedgenerering og -redigering?

Gemini 2.0 Flash er Googles nyeste AI-model, der er optimeret til hastighed ("Flash") og multimodale opgaver, og som nu tilbyder billedgenerering og -redigering i forhåndsvisning via Google AI Studio og Vertex AI. Forhåndsvisningen, der blev annonceret af Kat Kampf, produktchef for Google AI Studio, den 7. maj 2025, afslører modelnavnet. gemini-2.0-flash-preview-image-generation gennem GenAI API'en, hvilket muliggør højere anmodningsrater og problemfri integration i applikationer. India Today Tech bekræfter, at både gratis brugere (gennem Gemini-appen) og udviklere (via AI Studio/Vertex AI) kan eksperimentere med disse opgraderede værktøjer uden omkostninger – hvilket markerer en betydelig demokratisering af avanceret billed-AI.

Hvad adskiller Gemini 2.0 Flash fra tidligere udgivelser af billedgenerering?

Sammenlignet med den eksperimentelle billedmodel, der tidligere var indlejret i Gemini, tilbyder Flash:

Forbedret visuel kvalitetSkarpere detaljer, mere realistiske teksturer og bedre håndtering af fine elementer som hår, blade og refleksioner.
Forbedret tekstgengivelsePlacerer og formaterer tekst præcist i billeder, hvilket reducerer forvrængede bogstaver og forkert justerede glyffer, der var almindelige i tidligere versioner.
Lavere filterblokeringsraterAfslappede indholdsfiltre lader mere godartede prompts slippe igennem, samtidig med at politikken om ikke-tilladt materiale håndhæves, hvilket strømliner arbejdsgange for kompatible brugsscenarier.

Hvordan kan udviklere generere billeder ved hjælp af Gemini 2.0 Flash preview?

Generering af billeder er så simpelt som at kalde GenAI SDK eller REST API med din prompt og angive, at du ønsker både tekst- og billedmodaliteter.

Brug API'en i Google:

from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=("Show me an ultra-realistic watercolor painting of a city skyline at sunset"),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
)
print(response.images.url)

Dette uddrag illustrerer den minimale opsætning: erstat GEMINI_API_KEY med din nøgle, juster contents streng til din kreative vision, og modtag en URL til det genererede billede.

Brug Gemini 2.0 Flash-billedgenerering i CometAPI

Hvilke bedste praksisser giver de visuelle elementer af højeste kvalitet?

Vær specifik omkring stil og medie"Akvarelmaleri", "neon cyberpunk-scene" eller "minimalistisk vektorkunst" hjælper modellen med at forankre sit output.
Inkluder kompositionstipsSætninger som "tredjedelsregel", "dramatisk belysning fra venstre" eller "forgrundsmotiv i skarpt fokus" styrer kompositionen.
Gentag med opfølgningsprompterBrug samtaleredigeringer (se næste afsnit) til at justere farvebalancen, justere proportioner eller forfine detaljer uden at starte forfra.

Hvordan kan du redigere eksisterende billeder konversationsmæssigt?

Redigering fungerer ved at uploade et billede eller vælge et tidligere genereret element og derefter udstede instruktioner i naturligt sprog for at ændre specifikke områder eller attributter.

response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=(
       "Remove the background from this image, replace it with a snowy mountain vista, and enhance the subject's coat color to deep crimson."
   ),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
   input_image="gs://my-bucket/path/to/source.png"
)

Hvilke funktioner til redigering af samtaler understøttes?

Selektive redigeringerÆndr kun angivne områder (f.eks. "lys øjnene op", "tilføj kalligrafi til skiltet") uden at påvirke de omgivende pixels.
Samtegning i realtidGennem Gemini Co-Drawing Sample App kan flere samarbejdspartnere tegne og annotere direkte i AI Studio, hvilket accelererer iterative arbejdsgange.
RekontekstualiseringPlacer produkter eller karakterer i helt nye scener – ideelt til marketingmockups eller hurtig prototyping af visuelle koncepter.
Fjernelse af vandmærkeTidlige brugere rapporterer, at Gemini 2.0 Flash kan fjerne synlige vandmærker og erstatte dem med et neutralt SynthID-mærke, selvom etiske retningslinjer for brug gælder.

Gemini 2.0 Flash

Hvilke prisgrænser og priser gælder i forhåndsvisningen?

Google har fjernet mange begrænsninger fra forsøgsfasen: udviklere drager fordel af højere kvoter pr. minut og nedsatte forhåndsvisningspriser.

Hvordan er satsgrænserne blevet forbedret?

Øget QPSAnmodninger pr. sekund fordoblet sammenlignet med den tidligere eksperimentelle model, der understøtter bursty-arbejdsbelastninger og realtidsapplikationer.
Bulk redigeringGemini accepterer nu op til 10 billeder i en enkelt batch til redigering, hvilket strømliner arbejdsgange, der kræver ensartede stiljusteringer på tværs af flere aktiver.

Hvordan ser forhåndsvisningspriserne ud?

BilledgenereringCirka 0.039 USD pr. billede (3.9 cent), faktureret pr. unikt output.
RedigeringshandlingerPrisen er på samme måde som generationsjob, med yderligere rabatter planlagt, når forhåndsvisningen er afsluttet.

Hvordan får du adgang til og konfigurerer forhåndsvisningen i dag?

Log ind til Google AI Studio eller Vertex AI i Google Cloud Console.
Aktivér GenAI API'en og opret en API-nøgle under "Legitimationsoplysninger".
Type modellen gemini-2.0-flash-preview-image-generation i din kode eller API-kald.
Upload kildebilleder (hvis du redigerer) via Cloud Storage eller direkte i Studio-brugergrænsefladen.
påberåbe dine prompts og gennemgå output i Studio-dashboardet eller programmatisk.

Hvilke fremtidige forbedringer kan vi forvente?

Google har signaleret flere kommende forbedringer, når Gemini 2.0 Flash går ud over forhåndsvisning:

Udvidede muligheder

Udgange med højere opløsning (op til 4K+), ideel til trykte medier og store udstillinger.
Avanceret stilblanding, der kombinerer flere kunstneriske referencer i et enkelt billede.

Bredere integration

Indbygget understøttelse i Chrome, Docs og Slidesog andre G Suite-applikationer, hvilket muliggør oprettelse og redigering af billeder med et enkelt klik.
Forbedrede multimodale agenter (Projekt Astra), integration af billedopgaver i længere, kontekstbevidste samtaler.

Ved at muliggøre både billedgenerering og præcise redigeringer via en intuitiv samtalegrænseflade markerer Gemini 2.0 Flash-forhåndsvisningen en milepæl inden for tilgængelig, skalerbar AI-drevet kreativitet. Uanset om du prototyper produktvisualer, samarbejder om marketingaktiver eller blot udforsker nye kunstneriske horisonter, giver forhåndsvisningen dig værktøjerne til at iterere hurtigere og mere omfattende end nogensinde før. Efterhånden som forhåndsvisningen udvikler sig til fuld udgivelse, kan du forvente endnu dybere integration på tværs af Googles økosystem og stadigt mere sofistikerede funktioner til at fremme dit næste gennembrud.

Kom godt i gang

Udviklere kan få adgang Gemini 2.0 Flash Exp-Image-Generation API ved CometAPI. For at begynde skal du udforske modellens muligheder i Legepladsen og konsultere API guide (modelnavn: gemini-2.0-flash-exp-image-generation) for detaljerede instruktioner. Bemærk, at nogle udviklere muligvis skal verificere deres organisation, før de bruger modellen. Gemini 2.0 Flash pre-Image-Generation API lanceres snart.