ModellerPriserVirksomhed
500+ AI Model API, Alt I Én API. Kun I CometAPI
Modeller API
Udvikler
Hurtig StartDokumentationAPI Dashboard
Virksomhed
Om osVirksomhed
Ressourcer
AI-modellerBlogÆndringslogSupport
ServicevilkårPrivatlivspolitik
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

Indtast:$0.24/M
Output:$2/M
Kontekst:1M
Maks Output:65K
Gemini 2.5 Flash er en AI-model udviklet af Google, designet til at levere hurtige og omkostningseffektive løsninger til udviklere, især til applikationer der kræver forbedrede inferenskapaciteter. Ifølge Gemini 2.5 Flash-previewannoncen blev modellen frigivet i preview den 17. april 2025, understøtter multimodalt input og har et kontekstvindue på 1 million tokens. Denne model understøtter en maksimal kontekstlængde på 65,536 tokens.
Ny
Kommersiel brug
Playground
Oversigt
Funktioner
Priser
API
Versioner

Gemini 2.5 Flash er udviklet til at levere hurtige svar uden at gå på kompromis med outputkvaliteten. Den understøtter multimodale input, herunder tekst, billeder, lyd og video, hvilket gør den egnet til mange forskellige anvendelser. Modellen er tilgængelig via platforme som Google AI Studio og Vertex AI og giver udviklere de nødvendige værktøjer til problemfri integration i forskellige systemer.


Grundlæggende oplysninger (Funktioner)

Gemini 2.5 Flash introducerer flere markante funktioner, der adskiller den inden for Gemini 2.5-familien:

  • Hybrid ræsonnering: Udviklere kan angive en thinking_budget-parameter for præcist at styre, hvor mange tokens modellen bruger på intern ræsonnering før output.
  • Pareto-fronten: Positioneret på det optimale omkostnings-ydelsespunkt tilbyder Flash det bedste pris-til-intelligens-forhold blandt 2.5-modellerne.
  • Multimodal understøttelse: Behandler tekst, billeder, video og lyd nativt og muliggør mere righoldig samtale og analyse.
  • Kontekst på 1 million tokens: Enestående kontekstlængde, der muliggør dyb analyse og forståelse af lange dokumenter i én anmodning.

Modelversionering

Gemini 2.5 Flash har gennemgået følgende vigtige versioner:

  • gemini-2.5-flash-lite-preview-09-2025: Forbedret værktøjsanvendelighed: Bedre performance på komplekse opgaver i flere trin, med en 5% stigning i SWE-Bench Verified-scorer (fra 48.9% til 54%). Forbedret effektivitet: Ved aktivering af reasoning opnås output af højere kvalitet med færre tokens, hvilket reducerer latenstid og omkostninger.
  • Preview 04-17: Tidlig adgangsudgivelse med “thinking”-kapabilitet, tilgængelig via gemini-2.5-flash-preview-04-17.
  • Stabil General Availability (GA): Fra den 17. juni 2025 erstatter det stabile endpoint gemini-2.5-flash previewet og sikrer produktionsklar pålidelighed uden API-ændringer i forhold til previewet fra 20. maj.
  • Udfasning af Preview: Preview-endpoints var planlagt til nedlukning den 15. juli 2025; brugere skal migrere til GA-endpointet før denne dato.

Fra juli 2025 er Gemini 2.5 Flash nu offentligt tilgængelig og stabil (ingen ændringer fra gemini-2.5-flash-preview-05-20). Hvis du bruger gemini-2.5-flash-preview-04-17, fortsætter den eksisterende preview-prisfastsættelse indtil den planlagte udfasning af model-endpointet den 15. juli 2025, hvor det bliver lukket. Du kan migrere til den generelt tilgængelige model "gemini-2.5-flash".

Hurtigere, billigere, mere intelligent:

  • Designmål: lav latenstid + høj gennemstrømning + lave omkostninger;
  • Generel hastighedsforbedring i ræsonnering, multimodal behandling og lange tekstopgaver;
  • Tokenforbrug reduceres med 20–30%, hvilket markant sænker omkostningerne ved ræsonnering.

Tekniske specifikationer

Input-kontekstvindue: Op til 1 million tokens, hvilket muliggør omfattende kontekstbevarelse.

Output-tokens: I stand til at generere op til 8,192 tokens pr. svar.

Understøttede modaliteter: Tekst, billeder, lyd og video.

Integrationsplatforme: Tilgængelig via Google AI Studio og Vertex AI.

Prisfastsættelse: Konkurrencedygtig token-baseret prismodel, der faciliterer omkostningseffektiv implementering.


Tekniske detaljer

Under motorhjelmen er Gemini 2.5 Flash en transformer-baseret stor sprogmodel trænet på en blanding af web-, kode-, billede- og videodata. Centrale tekniske specifikationer omfatter:

Multimodal træning: Trænet til at tilpasse flere modaliteter; Flash kan problemfrit blande tekst med billeder, video eller lyd, nyttigt til opgaver som videosummering eller lydundertekster.

Dynamisk tænkeproces: Implementerer en intern ræsonneringssløjfe, hvor modellen planlægger og nedbryder komplekse prompts før endeligt output.

Konfigurerbare tænke-budgetter: thinking_budget kan indstilles fra 0 (ingen ræsonnering) op til 24,576 tokens, hvilket muliggør afvejninger mellem latenstid og svar-kvalitet.

Værktøjsintegration: Understøtter Grounding with Google Search, Code Execution, URL Context og Function Calling, hvilket muliggør realverdenshandlinger direkte fra naturlige sprog-prompts.


Benchmark-ydelse

I strenge evalueringer demonstrerer Gemini 2.5 Flash branchens førende performance:

  • LMArena Hard Prompts: Scorerede kun overgået af 2.5 Pro på den krævende Hard Prompts-benchmark og viste stærke evner i flertrinsræsonnering.
  • MMLU-score på 0.809: Overgår gennemsnitlig modelperformance med 0.809 MMLU-nøjagtighed, hvilket afspejler bred domæneviden og ræsonneringsstyrke.
  • Latenstid og gennemstrømning: Opnår 271.4 tokens/sec dekoderhastighed med 0.29 s Time-to-First-Token, hvilket gør den ideel til latenstidsfølsomme arbejdsbelastninger.
  • Førende på pris-ydelsesforhold: Ved \$0.26/1 M tokens underbyder Flash mange konkurrenter, samtidig med at den matcher eller overgår dem på centrale benchmarks.

Disse resultater indikerer Gemini 2.5 Flashs konkurrencemæssige fordel inden for ræsonnering, videnskabelig forståelse, matematisk problemløsning, kodning, visuel fortolkning og flersproglige kapaciteter:


Begrænsninger

Selvom den er kraftfuld, har Gemini 2.5 Flash visse begrænsninger:

  • Sikkerhedsrisici: Modellen kan udvise en “prædikende” tone og kan producere plausibelt klingende, men forkerte eller biased outputs (hallucinationer), især ved edge-case-forespørgsler. Omhyggeligt menneskeligt tilsyn er fortsat essentielt.
  • Rate limits: API-brug er begrænset af rate limits (10 RPM, 250,000 TPM, 250 RPD) på standardniveauer, hvilket kan påvirke batchbehandling eller højvolumenapplikationer.
  • Intelligens-niveau: Selvom den er usædvanligt kapabel for en flash-model, er den mindre præcis end 2.5 Pro på de mest krævende agentiske opgaver som avanceret kodning eller multi-agent-koordinering.
  • Omkostningsafvejninger: Selvom den tilbyder det bedste pris-ydelsesforhold, øger omfattende brug af thinking-tilstand det samlede tokenforbrug og dermed omkostningerne ved dybt ræsonnerende prompts.

Funktioner til Gemini 2.5 Flash

Udforsk de vigtigste funktioner i Gemini 2.5 Flash, designet til at forbedre ydeevne og brugervenlighed. Opdag hvordan disse muligheder kan gavne dine projekter og forbedre brugeroplevelsen.

Priser for Gemini 2.5 Flash

Udforsk konkurrencedygtige priser for Gemini 2.5 Flash, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan Gemini 2.5 Flash kan forbedre dine projekter, mens omkostningerne holdes håndterbare.

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Eksempelkode og API til Gemini 2.5 Flash

Gemini 2.5 Flash API er Googles nyeste multimodale AI-model, designet til højhastigheds- og omkostningseffektive opgaver med kontrollerbare ræsonneringsevner, som gør det muligt for udviklere at slå avancerede "thinking"-funktioner til eller fra via Gemini API'et.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-2.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            { text: "Tell me a three sentence bedtime story about a unicorn." },
          ],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Tell me a three sentence bedtime story about a unicorn."
          }
        ]
      }
    ]
  }'

Versioner af Gemini 2.5 Flash

Årsagen til, at Gemini 2.5 Flash har flere øjebliksbilleder kan omfatte potentielle faktorer såsom variationer i output efter opdateringer, der kræver ældre øjebliksbilleder for konsistens, at give udviklere en overgangsperiode til tilpasning og migration, og at forskellige øjebliksbilleder svarer til globale eller regionale slutpunkter for at optimere brugeroplevelsen. For detaljerede forskelle mellem versioner, henvises der til den officielle dokumentation.
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash
gemini-2.5-flash-image
gemini-2.5-flash-image-preview
gemini-2.5-flash-thinking
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-thinking

Flere modeller

C

Claude Opus 4.7

Indtast:$3/M
Output:$15/M
Den mest intelligente model til agenter og kodning
A

Claude Sonnet 4.6

Indtast:$2.4/M
Output:$12/M
Claude Sonnet 4.6 er vores hidtil mest kapable Sonnet-model. Det er en fuld opgradering af modellens færdigheder på tværs af kodning, computerbrug, langkontekstlig ræsonnering, agentplanlægning, vidensarbejde og design. Sonnet 4.6 har også et kontekstvindue på 1M tokens i beta.
O

GPT 5.5 Pro

Indtast:$24/M
Output:$144/M
En avanceret model udviklet til ekstremt kompleks logik og professionelle krav, der repræsenterer den højeste standard for dybdegående ræsonnering og præcise analytiske evner.
O

GPT 5.5

Indtast:$4/M
Output:$24/M
En multimodal flagskibsmodel af næste generation, der balancerer mellem enestående ydeevne og effektiv respons, dedikeret til at levere omfattende og stabile AI-tjenester til generelle formål.
O

GPT Image 2 ALL

Per anmodning:$0.04
GPT Image 2 er OpenAIs topmoderne billedgenereringsmodel til hurtig billedgenerering og -redigering i høj kvalitet. Den understøtter fleksible billedstørrelser og billedinput i høj kvalitet.
O

GPT 5.5 ALL

Indtast:$4/M
Output:$24/M
GPT-5.5 udmærker sig inden for kodning, online research, dataanalyse og operationer på tværs af værktøjer. Modellen øger ikke blot sin autonomi i håndteringen af komplekse flertrinsopgaver, men forbedrer også markant ræsonneringsevner og effektivitet i udførelsen, samtidig med at den bevarer samme latens som sin forgænger, hvilket markerer et vigtigt skridt mod automatiseret kontorautomatisering inden for AI.

Relaterede blogs

Nano Banana 2 Flash Kommer snart – Den lynhurtige udvikling af AI-billedgenerering
Jan 6, 2026
nano-banana-2

Nano Banana 2 Flash Kommer snart – Den lynhurtige udvikling af AI-billedgenerering

Google har endnu en gang forandret landskabet for generativ AI med Nano Banana 2 Flash Kommer snart, det nyeste tilskud til sin bredt anerkendte "Nano Banana"-billedgenereringsfamilie. Efter den enorme succes med Nano Banana Pro (Gemini 3 Pro Image) i slutningen af sidste år lover denne nye iteration at demokratisere visuel syntese i professionel kvalitet ved at kombinere den banebrydende intelligens i Gemini 3-arkitekturen med en hidtil uset hastighed og effektivitet.
Nano Banana-rabatter: En reel besparelse i 2026 for udviklere
Dec 25, 2025
nano-banana-pro

Nano Banana-rabatter: En reel besparelse i 2026 for udviklere

Konklusion: Det officielle Nano Banana API tilbyder ingen jule-, nytårs- eller andre højtidsrabatter. Dette er et faktum, som alle udviklere, der planlægger at bruge Nano Banana (inklusive Nano Banana Pro) til billedgenerering, indholdsskabelse eller produktintegration i 2026, skal forstå. Google tilbyder ikke sæsonmæssige rabatter på Nano Banana API'et, hvad enten det er jul, Black Friday eller nytår. Nano Banana API'ets prissystem er konsekvent stabilt og gennemsigtigt, med stort set ingen mulighed for rabatter. Så spørgsmålet er: Hvis du er udvikler, og hvis du planlægger at udføre billedgenerering i stor skala, modeltest eller produktiteration i julen eller til nytår, er der så nogen måde at reducere omkostningerne ved at bruge Nano Banana?
Er den gratis Gemini 2.5 Pro API nede? Ændringer i den gratis kvote i 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Er den gratis Gemini 2.5 Pro API nede? Ændringer i den gratis kvote i 2025

Google har markant strammet det gratis niveau for Gemini API: Gemini 2.5 Pro er blevet fjernet fra det gratis niveau, og Gemini 2.5 Flashs daglige gratis anmodninger er blevet skåret dramatisk ned (rapporter: ~250 → ~20/dag). Det betyder ikke, at modellen er permanent “død” til eksperimenter — men det betyder, at gratis adgang reelt er blevet udhulet for mange reelle brugsscenarier.
Den ultimative guide til nano-bananer: Sådan bruges den, og hvordan du får den bedste effekt
Sep 8, 2025
gemini-2-5-flash-image

Den ultimative guide til nano-bananer: Sådan bruges den, og hvordan du får den bedste effekt

Googles nylige udgivelse af Gemini 2.5 Flash Image – med øgenavnet "Nano-Banana" – er hurtigt blevet det foretrukne valg til billedredigering i samtaleform: den bevarer ligheder
Hvordan bruger man Nano Banana via API? (Gemini-2-5-flash-image)
Aug 28, 2025
gemini-2-5-flash-image

Hvordan bruger man Nano Banana via API? (Gemini-2-5-flash-image)

Nano Banana er fællesskabets kaldenavn (og interne forkortelse) for Googles Gemini 2.5 Flash Image — en multimodal billedgenerering i høj kvalitet med lav latenstid +