ModellerPriserBedrift
500+ AI-modell API, Alt I Én API. Bare I CometAPI
Modeller API
Utvikler
HurtigstartDokumentasjonAPI Dashbord
Selskap
Om ossBedrift
Ressurser
AI-modellerBloggEndringsloggStøtte
TjenestevilkårPersonvernerklæring
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

Inndata:$0.24/M
Utdata:$2/M
Kontekst:1M
Maks utdata:65K
Gemini 2.5 Flash er en KI-modell utviklet av Google, utformet for å tilby raske og kostnadseffektive løsninger for utviklere, spesielt for applikasjoner som krever forbedrede inferensevner. Ifølge forhåndsvisningskunngjøringen for Gemini 2.5 Flash ble modellen lansert i forhåndsvisning 17. april 2025, støtter multimodale inndata og har et kontekstvindu på 1 million tokens. Denne modellen støtter en maksimal kontekstlengde på 65,536 tokens.
Ny
Kommersiell bruk
Playground
Oversikt
Funksjoner
Priser
API
Versjoner

Gemini 2.5 Flash er konstruert for å levere raske svar uten å kompromittere kvaliteten på utdata. Den støtter multimodale inndata, inkludert tekst, bilder, lyd og video, noe som gjør den egnet for ulike bruksområder. Modellen er tilgjengelig via plattformer som Google AI Studio og Vertex AI, og gir utviklere verktøyene som trengs for sømløs integrasjon i ulike systemer.


Grunnleggende informasjon (Funksjoner)

Gemini 2.5 Flash introduserer flere fremtredende funksjoner som skiller den i Gemini 2.5-familien:

  • Hybrid Reasoning: Utviklere kan angi parameteren thinking_budget for å finjustere hvor mange token modellen dedikerer til intern resonnering før svar.
  • Pareto Frontier: Plassert ved det optimale kost–ytelsespunktet tilbyr Flash det beste pris‑til‑intelligens-forholdet blant 2.5‑modellene.
  • Multimodal Support: Behandler tekst, bilder, video og lyd naturlig, noe som muliggjør rikere samtale- og analysekapabiliteter.
  • 1 Million-Token Context: En enestående kontekstlengde muliggjør dyp analyse og forståelse av lange dokumenter i én enkelt forespørsel.

Modellversjonering

Gemini 2.5 Flash har gått gjennom følgende viktige versjoner:

  • gemini-2.5-flash-lite-preview-09-2025: Forbedret verktøybrukbarhet: Forbedret ytelse på komplekse, flertrinnsoppgaver, med en økning på 5% i SWE-Bench Verified-score (fra 48.9% til 54%). Forbedret effektivitet: Når resonnering aktiveres, oppnås utdata av høyere kvalitet med færre token, noe som reduserer ventetid og kostnader.
  • Preview 04-17: Tidlig tilgangsversjon med “thinking”-kapasitet, tilgjengelig via gemini-2.5-flash-preview-04-17.
  • Stable General Availability (GA): Fra og med 17. juni 2025 erstatter det stabile endepunktet gemini-2.5-flash forhåndsvisningen, og sikrer pålitelighet på produksjonsnivå uten API-endringer fra forhåndsvisningen 20. mai.
  • Utfasing av forhåndsvisning: Endepunktene for forhåndsvisning var planlagt stengt 15. juli 2025; brukere må migrere til GA-endepunktet før denne datoen.

Per juli 2025 er Gemini 2.5 Flash nå offentlig tilgjengelig og stabil (ingen endringer fra gemini-2.5-flash-preview-05-20). Hvis du bruker gemini-2.5-flash-preview-04-17, vil gjeldende forhåndsvisningspriser fortsette frem til den planlagte avviklingen av modellendepunktet 15. juli 2025, når det blir stengt. Du kan migrere til den generelt tilgjengelige modellen "gemini-2.5-flash".

Raskere, billigere, smartere:

  • Designmål: lav ventetid + høy gjennomstrømning + lave kostnader;
  • Generell akselerasjon i resonnering, multimodal prosessering og oppgaver med lange tekster;
  • Token-bruk er redusert med 20–30%, noe som reduserer resonneringskostnader betydelig.

Tekniske spesifikasjoner

Inndata-kontekstvindu: Opptil 1 million tokens, som muliggjør omfattende kontekstbevaring.

Utdata-tokens: Kan generere opptil 8,192 tokens per svar.

Støttede modaliteter: Tekst, bilder, lyd og video.

Integrasjonsplattformer: Tilgjengelig via Google AI Studio og Vertex AI.

Prising: Konkurransedyktig token-basert prismodell, som muliggjør kostnadseffektiv utrulling.


Tekniske detaljer

Under panseret er Gemini 2.5 Flash en transformer-basert stor språkmodell trent på en blanding av nett-, kode-, bilde- og videodata. Viktige tekniske spesifikasjoner inkluderer:

Multimodal trening: Trenet til å samstemme flere modaliteter, kan Flash sømløst blande tekst med bilder, video eller lyd, nyttig for oppgaver som videosammendrag eller lydteksting.
Dynamisk tankeprosess: Implementerer en intern resonnementssløyfe der modellen planlegger og bryter ned komplekse forespørsler før endelig svar.
Konfigurerbare thinking-budsjetter: thinking_budget kan settes fra 0 (ingen resonnering) opp til 24,576 tokens, noe som muliggjør avveiinger mellom ventetid og svarkvalitet.
Verktøyintegrasjon: Støtter Grounding with Google Search, Code Execution, URL Context og Function Calling, som muliggjør handlinger i den virkelige verden direkte fra naturlige språkforespørsler.


Benchmark-ytelse

I strenge evalueringer viser Gemini 2.5 Flash bransjeledende ytelse:

  • LMArena Hard Prompts: Oppnådde andreplass, kun etter 2.5 Pro, på det krevende Hard Prompts-benchmarket, som demonstrerer sterke evner til flertrinnsresonnering.
  • MMLU-score på 0.809: Overgår gjennomsnittlig modellytelse med en MMLU-nøyaktighet på 0.809, noe som reflekterer bred domeneinnsikt og resonneringsstyrke.
  • Latens og gjennomstrømning: Oppnår 271.4 tokens/sec dekodingshastighet med 0.29 s Time-to-First-Token, noe som gjør den ideell for latensfølsomme arbeidsbelastninger.
  • Leder på pris–ytelse: Med $0.26/1 M tokens underbyr Flash mange konkurrenter samtidig som den matcher eller overgår dem på sentrale benchmarker.

Disse resultatene indikerer Gemini 2.5 Flash sin konkurransefordel innen resonnering, vitenskapelig forståelse, matematisk problemløsning, koding, visuell tolkning og flerspråklige kapabiliteter:


Begrensninger

Mens den er kraftig, har Gemini 2.5 Flash enkelte begrensninger:

  • Sikkerhetsrisikoer: Modellen kan utvise en «belærende» tone og kan produsere plausible, men feilaktige eller partiske utdata (hallusinasjoner), særlig ved randtilfeller. Streng menneskelig oppfølging er fortsatt essensiell.
  • Hastighetsgrenser: API-bruk er begrenset av rate limits (10 RPM, 250,000 TPM, 250 RPD på standardnivåer), noe som kan påvirke batchprosessering eller applikasjoner med høyt volum.
  • Intelligens-terskel: Selv om den er usedvanlig kapabel for en «flash»-modell, er den fortsatt mindre nøyaktig enn 2.5 Pro på de mest krevende agent-baserte oppgavene som avansert koding eller fleragentkoordinering.
  • Kostnadsavveininger: Selv om den tilbyr best pris–ytelse, vil omfattende bruk av thinking-modus øke det totale token-forbruket og dermed kostnadene for dypt resonerende forespørsler.

Funksjoner for Gemini 2.5 Flash

Utforsk nøkkelfunksjonene til Gemini 2.5 Flash, designet for å forbedre ytelse og brukervennlighet. Oppdag hvordan disse mulighetene kan være til nytte for prosjektene dine og forbedre brukeropplevelsen.

Priser for Gemini 2.5 Flash

Utforsk konkurransedyktige priser for Gemini 2.5 Flash, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan Gemini 2.5 Flash kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Eksempelkode og API for Gemini 2.5 Flash

Gemini 2.5 Flash API er Googles nyeste multimodale KI-modell, utviklet for høyhastighets- og kostnadseffektive oppgaver med kontrollerbare resonneringsevner, som lar utviklere slå avanserte "thinking"-funksjoner av og på via Gemini API
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-2.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            { text: "Tell me a three sentence bedtime story about a unicorn." },
          ],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Tell me a three sentence bedtime story about a unicorn."
          }
        ]
      }
    ]
  }'

Versjoner av Gemini 2.5 Flash

Grunnen til at Gemini 2.5 Flash har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash
gemini-2.5-flash-image-preview
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-image
gemini-2.5-flash-thinking
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking

Flere modeller

C

Claude Opus 4.7

Inndata:$3/M
Utdata:$15/M
Den mest intelligente modellen for agenter og koding
A

Claude Sonnet 4.6

Inndata:$2.4/M
Utdata:$12/M
Claude Sonnet 4.6 er vår mest kapable Sonnet-modell hittil. Det er en fullstendig oppgradering av modellens ferdigheter innen koding, bruk av datamaskin, resonnering over lange kontekster, agentplanlegging, kunnskapsarbeid og design. Sonnet 4.6 har også et kontekstvindu på 1M token i beta.
O

GPT 5.5 Pro

Inndata:$24/M
Utdata:$144/M
En avansert modell utviklet for ekstremt kompleks logikk og profesjonelle krav, som representerer den høyeste standarden for dyp resonnering og analytisk presisjon.
O

GPT 5.5

Inndata:$4/M
Utdata:$24/M
En multimodal flaggskipsmodell av neste generasjon som balanserer eksepsjonell ytelse med effektiv respons, dedikert til å levere omfattende og stabile KI-tjenester for generelle formål.
O

GPT Image 2 ALL

Per forespørsel:$0.04
GPT Image 2 er OpenAIs toppmoderne bildegenereringsmodell for rask bildegenerering og redigering av høy kvalitet. Den støtter fleksible bildestørrelser og bildeinndata av høy kvalitet.
O

GPT 5.5 ALL

Inndata:$4/M
Utdata:$24/M
GPT-5.5 utmerker seg innen koding, nettbasert informasjonsinnhenting, dataanalyse og operasjoner på tvers av verktøy. Modellen forbedrer ikke bare sin autonomi i håndteringen av komplekse flertrinnsoppgaver, men øker også resonnementsevnen og effektiviteten i utførelsen betydelig, samtidig som den opprettholder samme latenstid som forgjengeren, og markerer et viktig steg mot automatisert kontorautomatisering i KI.

Relaterte blogger

Nano Banana 2 Flash Kommer snart – Den lynraske utviklingen innen AI-bildegenerering
Jan 6, 2026
nano-banana-2

Nano Banana 2 Flash Kommer snart – Den lynraske utviklingen innen AI-bildegenerering

Google har nok en gang forrykket landskapet for generativ KI med Nano Banana 2 Flash, som snart kommer – det nyeste tilskuddet til den bredt anerkjente «Nano Banana»-familien for bildegenerering. Etter den enorme suksessen til Nano Banana Pro (Gemini 3 Pro Image) sent i fjor, lover denne nye iterasjonen å demokratisere visuell syntese på profesjonelt nivå ved å kombinere den banebrytende intelligensen i Gemini 3-arkitekturen med enestående hastighet og effektivitet.
Nano Banana-rabatter: Virkelig penger å spare i 2026 for utviklere
Dec 25, 2025
nano-banana-pro

Nano Banana-rabatter: Virkelig penger å spare i 2026 for utviklere

Oppsummert: Den offisielle Nano Banana API-et tilbyr ingen rabatter til jul, nyttår eller andre høytider. Dette er et faktum som alle utviklere som planlegger å bruke Nano Banana (inkludert Nano Banana Pro) til bildegenerering, innholdsproduksjon eller produktintegrasjon i 2026, må forstå. Google tilbyr ikke sesongrabatter for Nano Banana API-et, enten det er jul, Black Friday eller nyttår. Det offisielle API-ets prissystem er konsekvent stabilt og transparent, med praktisk talt ikke noe rom for rabatter. Spørsmålet er derfor: Hvis du er utvikler, og hvis du planlegger å gjennomføre storskala bildegenerering, modelltesting eller produktiterasjon i julen eller ved nyttår, finnes det noen måte å redusere kostnadene ved å bruke Nano Banana?
Er Free Gemini 2.5 Pro API nede? Endringer i gratiskvoten i 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Er Free Gemini 2.5 Pro API nede? Endringer i gratiskvoten i 2025

Google har kraftig strammet inn gratisnivået for Gemini API: Gemini 2.5 Pro er fjernet fra gratisnivået, og de daglige gratisforespørslene for Gemini 2.5 Flash ble kraftig redusert (rapporter: ~250 → ~20/dag). Det betyr ikke at modellen er permanent "død" for eksperimentering — men det betyr at gratis tilgang i praksis er blitt sterkt redusert for mange reelle brukstilfeller.
Den ultimate guiden til nano-bananer: Slik bruker du og oppfordrer til best resultat
Sep 8, 2025
gemini-2-5-flash-image

Den ultimate guiden til nano-bananer: Slik bruker du og oppfordrer til best resultat

Googles nylige utgivelse av Gemini 2.5 Flash Image – med kallenavnet «Nano-Banana» – har raskt blitt det foretrukne valget for samtalebasert bilderedigering: den bevarer likheter
Hvordan bruke Nano Banana via API? (Gemini-2-5-flash-image)
Aug 28, 2025
gemini-2-5-flash-image

Hvordan bruke Nano Banana via API? (Gemini-2-5-flash-image)

Nano Banana er kallenavnet (og den interne forkortelsen) for Googles Gemini 2.5 Flash Image – en multimodal bildegenerering av høy kvalitet med lav latens.