Googles utgivelsessyklus fra mars til april 2025 leverte den første offentlige forhåndsvisningen av Gemini 2.5 Pro, en «tenkende» multimodal modell som har et kontekstvindu på én million tokens og de sterkeste resonneringspoengene av alle Google-modeller hittil. Selskapet beholdt en gratis kvote for Gemini 2.5 Pro, men flyttet den til et eksperimentelt endepunkt (gemini‑2.5‑pro‑exp‑03‑25) mens du slår på fakturering for forhåndsvisningen av produksjonen (gemini‑2.5‑pro‑preview‑03‑25Utviklere får derfor kostnadsfri tilgang til utforskning av Gemini 2.5 Pro, pluss en tydelig oppgraderingsvei når de trenger høyere prisgrenser eller SLA-garantier. I mellomtiden utvidet Google Cloud Next 2025 Gemini-integrasjonene på tvers av Vertex AI, nye TPU v7 «Ironwood» og Agent Engine-stakken, noe som signaliserer at Gemini 2.5 Pro er midtpunktet i Googles visjon for agentisk databehandling, spesielt for de som søker kraftige verktøy i AI-landskapet.
Hva gjør Gemini 2.5 Pro annerledes enn tidligere Gemini-modeller?
1. Hvordan fungerer egentlig «tenkemekanismen»?
Gemini sin interne tankekjede-eksekutor kjører latente planleggingstrinn før den strømmer et endelig svar, på samme måte som DeepMinds AlphaCode 2-pipeline. Google kaller dette «tenkemodus», og i 2.5 Pro er den alltid på, mens den i 1.5 Pro måtte aktiveres manuelt ved å legge til parameteren thinking=true. Resultatet er sterkere ytelse på kodegenerering, avanserte matematiske bevis og flertrinns resonneringsoppgaver.
I bunn og grunn representerer Gemini 2.5 Pro et betydelig sprang fremover innen AI-muligheter, noe som gjør det til et verdifullt verktøy for både utviklere og forskere.
Med Gemini 2.5 kan brukere låse opp innovative funksjoner og muligheter som forbedrer AI-opplevelsen ytterligere.
2. Hvorfor er kontekstvinduet for én million tokener banebrytende?
Et vindu med én million tokens (~750 MB tekst) lar deg mate inn hele kodelager, PDF-er med flere kapitler eller timer med transkribert video i én enkelt ledetekst. Det er 10× GPT-4os standard 128k kontekst og tilsvarer omtrent Anthropics Claude 3-200k, men til null kostnad i det eksperimentelle nivået.
3. Har Gemini 2.5 Pro funksjoner for bilde og lyd?
Ja. I likhet med 1.5 Pro er den innebygd multimodal: samme endepunkt tar inn tekst, bilder eller korte lydklipp uten å bytte modell. Forskjellen er langformatsvideoforståelse (opptil 10 minutter, mot 90 sekunder i 1.5 Pro) og innebygde bilder med høyere oppløsning.
Hvor mye av Gemini 2.5 Pro er egentlig gratis i 2025?
«Hva gir det eksperimentelle gratisnivået meg?»
| Metric | Gratis eksperimentell (gemini‑2.5‑pro‑exp‑03‑25) | Forhåndsvisning av betalt nivå |
|---|---|---|
| Forespørsler per minutt | 25 RPM | 180 o/min (myk hette) |
| Tokener inn/ut per minutt | 250k | 2 millioner |
| Daglig forespørselsgrense | 500 XNUMX XNUMX RPD | 5 omdreiningstall per minutt |
| SLA | Beste innsats | 99.9% |
| Pris | $0 | 0.005 kr / 1 inngangstokener + 0.015 kr / 1 utgangstokener |
Takeaway: For prototyper, personlige verktøy eller klasseromsprosjekter er det eksperimentelle endepunktet i praksis ubegrenset. For produksjonsarbeidsbelastninger er forhåndsvisnings-SKU-en fortsatt billigere enn GPT-4o med samme kontekstlengde.
Utforsk måter å få tilgang til gratis Gemini 2.5 Exp
1. AI Studios innebygde gratis forhåndsvisning
Hva er det?
Google satte Gemini 2.5 Pro og 2.5 Flash til 0 dollar priser inne i AI Studio i mars 2025, og kalte det en «gratis forhåndsvisning». Hver ny API-nøkkel arver kvoten.
Slik aktiverer du
- Besøk
https://aistudio.google.com/apikey. - Klikk Opprett API-nøkkel → Gemini 2.5 Pro.
- Lim inn nøkkelen på 40 tegn i appen din (
export GEMINI_API_KEY=...).
Grenser som fortsatt gjelder
- 60 forespørsler per minutt, 3 per time vedvarende.
- 300 XNUMX tokens per UTC-dag (prompt + fullføring).
Hvis du overskrider en av dem, får du HTTP 429 inntil vinduet tilbakestilles.
2. Utdanning og oppstartskampanjer
Student/fakultet «ubegrenset» nivå
Google lar alle med en institusjonell e-postadresse (.edu, .ac, .edu.tr osv.) eller et gyldig ISIC kortet oppgraderer AI Studio-nøkkelen sin. Dashbordetiketten endres til Studentnivå – ubegrensede tokens og sluttdatoen lyder 30. juni 2026.
Steps
- På samme API-nøkkelside velger du Bekreft med studentbevis.
- Last opp kortet ditt eller klikk på campus-SSO-knappen.
- Godkjenning skjer umiddelbart for de fleste amerikanske/EU-domener; manuell gjennomgang kan ta 24 timer andre steder.
Heads-up: Google sender en e-post med en lenke for ny bekreftelse 31. august 2025; bommer du på det, faller du tilbake til den offentlige kvoten.
Googles AI-fond for oppstartsbedrifter
Såkornbedrifter som blir tatt opp i programmet, mottar en kupong som låser opp per prosjekt ubegrensede samtaler inn Vertex AI i 12 måneder.
- Opprett et skyprosjekt → Vertex AI → Generative modeller → Aktiver kupong.
- Gratis kvote skaleres med hvert ekstra prosjekt, slik at mikrotjenester kan ligge i separate prosjekter uten kostnad.
3. Tredjeparts gatewayer og IDE-plugin-moduler
Åpne ruteren
OpenRouter eksponerer Googles offentlige «gemini-2.5-pro-exp-03-25:free»-modell gjennom sitt eget nøkkelsystem. Hvis AI Studio-kvoten din går tom, bytt endepunkter, men fortsett kodingen uavbrutt.
bashcurl https://openrouter.ai/api/v1 \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-d '{
"model":"google/gemini-2.5-pro-exp-03-25:free",
"messages":
}'
Roo Code og Cline (VS Code-utvidelser)
Begge IDE-verktøyene konfigurerer OpenRouter automatisk for deg: lim inn enten din egen AI Studio-nøkkel or en OpenRouter-nøkkel og velg gratis Gemini-varianten fra en rullegardinmeny.
Markør-IDE-snarvei
Markøren pakker en ferdiglaget «Gemini 2.5 Free»-profil; å slå den av og på ruter trafikken via Google eller OpenRouter, avhengig av hvilken som fortsatt har kvote.
Advarsler
- Forespørsler sendes via proxy, så du godtar OpenRouters eller IDE-ens personvernvilkår.
- Gjennomstrømningen er begrenset til ~30 req/min for å forhindre misbruk.
- Hvis Google noen gang fjerner det offentlige gratis endepunktet, vil disse tjenestene slutte å fungere.
CometAPI
CometAPI gir tilgang til over 500 AI-modeller, inkludert åpen kildekode og spesialiserte multimodale modeller for chat, bilder, kode og mer. Dens primære styrke ligger i å forenkle den tradisjonelt komplekse prosessen med AI-integrasjon. Tilgang Gemini 2.5 Pro API via CometAPI-nøkkel
CometAPI tilby en pris som er langt lavere enn den offisielle prisen for å hjelpe deg med å integrere Gemini 2.5 Pro API, og du vil få $1 på kontoen din etter registrering og innlogging! Velkommen til å registrere deg og oppleve CometAPI.CometAPI betaler mens du går,Gemini 2.5 Pro API (modellnavn: gemini-2.5-pro-preview-03-25; gemini-2.5-pro-exp-03-25) i CometAPI Prissetting er strukturert som følger:
- Input tokens: $2 / M tokens
- Output tokens: $8 / M tokens
For rask integrasjon, se API-dok
Gratis prøveperiode: Registrer deg og få en prøveperiode på $1
Forutsetninger: Registrer deg og logg inn for å få API-nøkkelen for å konfigurere xx til arbeidsflyten din.
4. Gemini sin offisielle nettside
Gjennom gemini.google.com kan brukere få direkte tilgang til Gemini 2.5 Pro-modellen.
Registrer deg for å oppgradere ChatGPT | Claude 3 | GPT-5 Oppgraderingsveiledningsnettverk
Gratis prøveperiode: Nye brukere kan oppgradere til Gemini Advanced gratis og nyte en gratis prøveperiode på én måned.
Forutsetninger: Ny brukeridentitet og kredittkortbinding kreves. Kredittkort av typen Visa eller Mastercard anbefales.
Komme i gang om fem minutter
A. Trenger du Google AI Studio eller direkte REST-kall?
- Google AI Studio er den raskeste påkjørselen: logg inn med en hvilken som helst Google-konto, lag instruksjoner i et notatboklignende brukergrensesnitt, og klikk deretter «Hent API-nøkkel» for å skaffe et token som allerede er tildelt det eksperimentelle nivået.
- Direkte REST / gRPC er bedre for CI-pipeliner. Bruk
https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContentmed nøkkelen din ikeyspørreparameter eller som et Bearer-token.
B. Eksempel på krøll for en multimodal ledetekst
bashcurl -s \
-H "Authorization: Bearer $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-X POST \
-d '{
"contents":[
{"parts":},
{"mimeType":"image/png","data":"$(base64 -w0 chart.png)"}
]
}' \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContent"
Hva er de nye «rate limit»-feilene?
«Hvorfor ser jeg 429 feil selv under de dokumenterte grensene?»
Google la stille til burstgrenserDu kan ikke overskride 120 forespørsler i et rullerende femminuttersvindu, uavhengig av RPM. Implementer tokenbøtte backoff-logikk eller bruk den innebygde kvotebevisste klienten i google‑generativeai Python SDK v0.6.0.
«Kan jeg blande 1.5 Pro og 2.5 Pro i samme prosjekt for å spare kvote?»
Ja, men kvoter er samlet per modellfamilieAnrop til 1.5 Pro teller fortsatt mot den daglige forespørselskvoten for 2.5 Pro i det eksperimentelle nivået, fordi begge faller inn under «Tenkende modeller» kvotegruppe. Del arbeidsbelastninger inn i separate Google Cloud-prosjekter hvis du ønsker isolerte kvoter.
Sikkerhets- og samsvarsoppdateringer du ikke må ignorere
1. Datalagring og GDPR
Logging for 2.5 Pro gjenstår i regionen for EU-kunder via Google Clouds regionale EU-endepunkt, som tilfredsstiller Schrems II-anbefalingene – en oppgradering i forhold til den globale rutingen som brukes av 1.0- og 1.5-utgivelsene.
2. Reviderbarhet
Ny Tenkende spor la bedriftskunder i Vertex AI registrere modellens latente resonnementstrinn for revisjon. Spor lagres kryptert i 14 dager og kan eksporteres til BigQuery. Funksjonen er ikke i det gratis eksperimentelle nivået.
3. Innholdssikkerhet
Gemini 2.5 Pro arver «Sikkerhetsfiltre v2» rørledning, og legger til en strengere selvskadingsklassifisering finjustert på 50 XNUMX Reddit-innlegg flagget av krisetelefonlinjer – en direkte respons på fjorårets britiske lov om nettsikkerhet. IT Pro
Ytelsesmål: hvor skinner Gemini 2.5 Pro?
️Kodegenerering
Benchmarks på HumanEval+ viser en 9 % absolutt gevinst over 1.5 Pro og en ledelse på 2 % over GPT-4o, med identiske temperaturinnstillinger = 0.
Dataanalyse
På GSM-Hard-datasettet scorer 2.5 Pro 94 %, opp fra 88 % for 1.5 Pro og 92 % for Claude 3 Haiku. Forbedringen kan spores direkte til den «tenkende» utføreren.
Spørsmål og svar om visjon
I MMMU-referanseindeksen diagramresonnement Delmengden, 2.5 Pro, er lik Gemini 2.0 Flash på 87 %, men henger etter GPT-4o (89 %). Multimodale utviklere bør derfor beholde Flash for rene visuelle oppgaver.
Integrasjoner annonsert på Google Cloud Next 2025
«Hvordan kjører jeg 2.5 Pro med andre Google AI-tjenester?»
- Vertex AI Agent Engine – kjede 2.5 Pro med oppgavespesifikke agenter som Code Assist eller Document AI.
- TPU v7 Ironwood – treningsjobber bytter automatisk til Ironwood når du finjusterer på >1 B tokens, noe som kutter kostnadene med 35 %.
- Agentspace / Agent2Agent-protokoll – åpen kildekode-spesifikasjon slik at 2.5 Pro-agenter kan ringe Anthropic- eller OpenAI-kolleger.
Migreringssjekkliste for team som oppgraderer fra 1.5 Pro
- Bytt modellnavn – oppdatering fra
gemini-1.5-pro-latesttilgemini-2.5-pro-exp-03-25. - Øk kontekst/tidsavbrudd – sett
timeout = 600 sfor store sammenhenger. - Sjekk sikkerhetsinnstillingene – standardverdiene er strengere; juster
safetySettingsetter behov. - Juster temperaturen – 2.5 Pro er mer deterministisk; øk temperaturen med 0.2 for kreative oppgaver.
- Revurder kvoten – gratisnivå gir mer tokens per minutt, men færre forespørsler; batch-kall.
Ofte stilte fallgruver
«Strømmingssvarene stopper opp ved 256 XNUMX tokens – en feil?»
Nei. Det eksperimentelle endepunktet strømmer fint opptil 512 256 utdatatokener, men mange klientbiblioteker bruker fortsatt en standard lesebuffer på 2 XNUMX. Øk bufferen eller bytt til HTTP/XNUMX.
«Hvorfor kommer bilder av og til tilbake INVALID_ARGUMENT? "
Gemini avviser bilder >20 MB eller med EXIF GPS-tagger i gratisnivået for å begrense misbruk. Fjern metadata eller komprimer.
Veikart: hva er det neste for gratis Gemini-tilgang?
Googles utgivelsesnotater antyder 2 M-token-kontekster og Kvantiserte varianter av Edge TPU senere i 2025. Bransjeanalytikere forventer en "Tvillingenes kant" modell som kan kjøre fullt ut på enheten for Android 16, noe som speiler Apples ryktede Ajax-Edge.
Konklusjon
Gemini 2.5 Pros gratis eksperimentelle nivå er generøst nok for rask prototyping, samtidig som det tilbyr en enkel vei til betalt bruk med høyere gjennomstrømning. Modellens innebygde tenkningsutfører, massive kontekstvindu og dype Vertex AI-integrasjon gjør den til et overbevisende grunnlag for agentapplikasjoner i 2025-æraen – fra kodeledsagere og datapiloter til multimodale søke- og samsvarsroboter. Ta det i bruk nå for å fremtidssikre stacken din, men planlegg for kvotehåndtering, strengere sikkerhetsstandarder og utviklende endepunktnavn etter hvert som Google itererer gjennom forhåndsvisningsfaser.
