På Google I/O 2025, der blev afholdt i Mountain View, Californien, afslørede Google DeepMind- og Google AI-teams betydelige forbedringer af deres Gemini 2.5-serie af modeller til store sprog. Disse opdateringer dækker både Gemini 2.5 Pro og Gemini 2.5 Flash varianter, der introducerer avancerede ræsonnementfunktioner, native lydoutput, flersproget understøttelse, sikkerhedsforanstaltninger og betydelige effektivitetsgevinster. Samlet set har disse forbedringer til formål at give udviklere, virksomheder og slutbrugere mere pålidelige, naturlige og omkostningseffektive AI-tjenester på tværs af Google AI Studio, Gemini API og Vertex AI.
Gemini 2.5 Pro-forbedringer
Dyb tænkning: Forbedret multihypotesisk ræsonnement
En marquee-funktion til 2.5 Pro er Dyb tænkning, en eksperimentel ræsonnementstilstand, der gør det muligt for modellen internt at generere, sammenligne og forfine flere løsningsveje, før den producerer sit endelige output. Tidlige benchmarks demonstrerer Deep Thinks dygtighed: den fører i USAMO-matematikeksamenen i 2025, topper LiveCodeBench for kodning på konkurrenceniveau og scorer 84.0% på MMMU multimodal ræsonnementstesten.
Fra denne måned er Deep Think tilgængelig for "betroede testere" via Gemini API'en. Google har udtalt, at de har brug for mere tid til sikkerhedsvurderinger, før Deep Think bliver mere bredt tilgængeligt.

Indbygget lyd og flersproget dialog
Gemini 2.5 Pro bygger videre på sine tekstfunktioner og understøtter nu oprindelig lydudgang på tværs af 24 sprog. Denne funktion leverer kontekstbevidst prosodi og følelsesmæssig bøjning, hvilket får AI-interaktioner til at føles mere menneskelige. Udover lyd tilpasser modellens dialogsystem tonen dynamisk – hvilket forstærker empati i kundeservice- og uddannelsesapplikationer. Tidlige demonstrationer omfattede realtids-stemmechats med nuanceret vægtning og flersprogede kodegennemgange, hvilket fremhævede Googles satsning på ægte konversationel AI.
Sikkerhed og troværdighed
Sikkerhedsforbedringer i 2.5 Pro fokuserer på at afbøde indirekte prompt-injection-angreb. Det opdaterede framework anvender strengere inputrensning og dynamisk kontekstfiltrering, hvilket er essentielt for regulerede brancher, der håndterer følsomme data. Ifølge Googles udviklerblog reducerer disse sikkerhedsforanstaltninger sårbarheden med op til 40 % i interne red-team-evalueringer, hvilket lægger grundlaget for bredere implementering i virksomheder.
Gemini 2.5 Flash-optimeringer
Effektivitet og hastighed
Gemini 2.5 Flash, den latenstidsoptimerede søskende til 2.5 Pro, er blevet opdateret til 22% større beregningseffektivitet og hurtigere svartider. Under hovedtalen bemærkede Demis Hassabis, at Flash nu "præsterer bedre i næsten alle dimensioner" sammenlignet med sin forgænger, med forhåndsvisninger tilgængelige for udviklere i Google AI Studio, Vertex AI og Gemini-mobilappen. Den generelle tilgængelighed er planlagt til begyndelsen af juni 2025. Den seneste version af Gemini 2.5 flash, der er udgivet i øjeblikket, er gemini-2.5-flash-preview-05-20 på Google I/O 2025.
Udvidede multimodale muligheder
Både Flash- og Pro-varianterne deler nye multimodale ræsonnementsevner, der giver brugerne mulighed for at arbejde sammen på tekst, billeder, lyd og endda videoinput. Bemærkelsesværdige use cases, der blev vist ved I/O, omfattede fraktale visualiseringer genereret fra en enkelt prompt og "Video to Learning App"-pipelines, der konverterer instruktionsvideoer til interaktive uddannelsesoplevelser.
Opdateringer til udviklernes økosystem
Google AI Studio-integration
Google AI Studio tilbyder nu problemfri adgang til både Gemini 2.5 Pro og Flash. Den indbyggede kodeeditor integrerer modellerne direkte, hvilket gør det muligt for udviklere at generere produktionsklare webapps via enkle prompts. Starterskabeloner viser opgaver fra samtalemedarbejdere med lyd til dashboards til dataanalyse i realtid, hvilket reducerer prototypecyklusser fra uger til minutter.
Gemini API-forbedringer
Gemini API har modtaget flere opdateringer:
- Strømlinet funktionskaldForenklede skemadefinitioner reducerer integrationsindsatsen med 30 %.
- Tænkning om budgetkontrolUdviklere kan nu indtaste dybdegående ræsonnement for at afveje omkostninger og ydelse.
- Agentiske arbejdsgangeNye slutpunkter understøtter flertrins agentorkestrering via Projekt Mariner, hvilket gør det muligt for AI'en autonomt at udføre op til 10 sammenkædede opgaver (f.eks. datahentning, opsummering og rapportgenerering) med et enkelt kald.
Gemini Code Assist Generel tilgængelighed
Tvillingernes 2.5 kræfter Gemini Code Assist til enkeltpersoner og GitHub-integrationer, nu generelt tilgængelig på gratis og betalte niveauer. Dette værktøj udmærker sig ved kodetransformation, generering af frontend-UI og automatiseret refactoring og opfylder behovene hos både nye programmører og erfarne ingeniører.
Tilgængelighed og prisfastsættelse
Gemini 2.5-serien er tilgængelig for alle Google Cloud-kunder via Vertex AI, hvor ydeevneniveauer bestemmes af abonnementsniveau:
- AI Pro ($19.99/måned) giver adgang til Gemini 2.5 Flash og standard 2.5 Pro-funktioner.
- AI Ultra ($249.99/måned) giver adgang til Deep Think, prioriteret gennemløbshastighed og den fulde pakke af multimodale og agentiske funktioner, sammen med bundtede tjenester som 30 TB cloudlager og YouTube Premium.
Konklusion og Outlook
Med de seneste Gemini 2.5 Pro- og Flash-opdateringer sætter Google en ny standard for AI-ræsonnement, interaktivitet og udviklerproduktivitet. Deep Thinks evaluering af flere hypoteser, kombineret med native lyd, sikkerhedsforbedringer og effektivitetsgevinster, baner vejen for mere intelligente, pålidelige og tilgængelige AI-systemer. Når disse modeller rulles ud i juni, vil deres integration på tværs af Google AI Studio, Gemini API og Vertex AI accelerere innovation - fra smartere kodningsassistenter til immersive uddannelsesværktøjer - og omforme, hvordan enkeltpersoner og organisationer udnytter kunstig intelligens.
Kom godt i gang
CometAPI leverer en samlet REST-grænseflade, der samler hundredvis af AI-modeller – inklusive Gemini-familien – under et ensartet slutpunkt med indbygget API-nøglestyring, brugskvoter og faktureringsdashboards. I stedet for at jonglere med flere leverandør-URL'er og legitimationsoplysninger.
Udviklere kan få adgang Gemini 2.5 Flash Pre API (model:gemini-2.5-flash-preview-05-20) og Gemini 2.5 Pro API (model:gemini-2.5-pro-preview-05-06)osv. igennem CometAPI. For at begynde skal du udforske modellens muligheder i Legepladsen og konsultere API guide for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen.
