API di anteprima di Gemini 3 Pro

CometAPI
AnnaDec 10, 2025
API di anteprima di Gemini 3 Pro

Gemini 3 Pro (Anteprima) è il nuovo modello di ragionamento multimodale di punta di Google/DeepMind nella famiglia Gemini 3. Si posiziona come il loro "modello più intelligente di sempre", progettato per il ragionamento approfondito, i flussi di lavoro agentici, la codifica avanzata e la comprensione multimodale a lungo contesto (testo, immagini, audio, video, codice e integrazioni di strumenti).

Funzionalità principali

  • Modalità: Testo, immagine, video, audio, PDF (e output di strumenti strutturati).
  • Agentic/strumenti: Chiamata di funzioni integrata, ricerca come strumento, esecuzione di codice, contesto URL e supporto per l'orchestrazione di agenti multi-step. Il meccanismo di firma del pensiero preserva il ragionamento multi-step tra le chiamate.
  • Coding e “vibe coding”: Ottimizzato per la generazione di front-end, la generazione di interfacce utente interattive e la codifica agentica (è in cima alle classifiche pertinenti segnalate da Google). È pubblicizzato come il loro modello di "vibe-coding" più potente finora.
  • Nuovi controlli per gli sviluppatori: thinking_level (basso|alto) per bilanciare costo/latenza vs profondità di ragionamento, e media_resolution Controlla la fedeltà multimodale per immagine o fotogramma video. Ciò aiuta a bilanciare prestazioni, latenza e costi.

Prestazioni di riferimento

  • Il Gemini3Pro ha ottenuto il primo posto in LMARE con un punteggio di 1501, superando i 1484 punti di Grok-4.1-thinking e superando anche Claude Sonnet 4.5 e Opus 4.1.
  • Ha inoltre ottenuto il primo posto nell'arena di programmazione WebDevArena con un punteggio di 1487.
  • Nel ragionamento accademico dell'Ultimo esame dell'umanità ha ottenuto il 37.5% (senza strumenti); nella scienza GPQA Diamond il 91.9%; e nella competizione matematica MathArena Apex il 23.4%, stabilendo un nuovo record.
  • Nelle capacità multimodali, MMMU-Pro ha raggiunto l'81%; nella comprensione video Video-MMMU, l'87.6%.

API di anteprima di Gemini 3 Pro

Dettagli tecnici e architettura

  • Parametro “livello di pensiero”: Gemini 3 espone un thinking_level controllo che consente agli sviluppatori di bilanciare la profondità del ragionamento interno con latenza/costo. Il modello tratta thinking_level come una tolleranza relativa per il ragionamento interno multi-step piuttosto che una rigorosa garanzia simbolica. Il default è in genere high per Pro. Si tratta di un nuovo controllo esplicito che consente agli sviluppatori di ottimizzare la pianificazione in più fasi e la profondità della catena di pensiero.
  • Risultati e strumenti strutturati: Il modello supporta output JSON strutturati e può essere combinato con strumenti integrati (base di ricerca Google, contesto URL, esecuzione di codice, ecc.). Alcune funzionalità di output strutturato+strumenti sono disponibili solo in anteprima per gemini-3-pro-preview.
  • Integrazioni multimodali e agentiche: Gemini 3 Pro è stato progettato espressamente per flussi di lavoro agentici (strumenti + più agenti su codice/terminali/browser).
  • Accetta input di testo, immagini, video, audio e PDF; output di testo.

Limitazioni e avvertenze note

  1. Non si tratta di una fattualità perfetta: le allucinazioni restano possibili. Nonostante i notevoli miglioramenti in termini di fattualità dichiarati da Google, la verifica fondata e la revisione umana sono ancora necessarie in contesti ad alto rischio (legali, medici, finanziari).
  2. Le prestazioni nel contesto lungo variano a seconda dell'attività. Il supporto per una finestra di input da 1M è una funzionalità difficile da implementare, ma l'efficacia empirica può diminuire su alcuni benchmark a lunghezze estreme (sono stati osservati cali puntuali a 1M su alcuni test di contesto prolungato).
  3. Compromessi tra costi e latenza. Contesti ampi e superiori thinking_level le impostazioni aumentano il calcolo, la latenza e i costi; i livelli di prezzo si applicano in base ai volumi di token. Usa thinking_level e strategie di suddivisione in blocchi per gestire i costi.
  4. Filtri di sicurezza e contenuti. Google continua ad applicare norme di sicurezza e livelli di moderazione; alcuni contenuti e azioni rimangono limitati o attiveranno modalità di rifiuto.

Come Gemini 3 Pro Preview si confronta con altri modelli di punta

Confronto di alto livello (anteprima → qualitativo):

Contro Gemini 2.5 Pro: Miglioramenti radicali nel ragionamento, nell'uso di strumenti agentivi e nell'integrazione multimodale; gestione di contesti molto più ampi e migliore comprensione di contenuti di lunga durata. DeepMind mostra miglioramenti costanti nel ragionamento accademico, nella codifica e nelle attività multimodali.

Contro GPT-5.1 e Claude Sonnet 4.5 (come riportato): Nella classifica di benchmark di Google/DeepMind, Gemini 3 Pro si posiziona al primo posto in diverse metriche agentiche, multimodali e di lungo contesto (vedi Terminal-Bench, MMMU-Pro, AIME). I risultati comparativi variano a seconda dell'attività.


Casi d'uso tipici e di alto valore

  • Riepilogo di documenti/libri di grandi dimensioni e domande e risposte: il lungo supporto contestuale lo rende interessante per i team legali, di ricerca e di conformità.
  • Comprensione e generazione del codice su scala di repository: l'integrazione con le catene di strumenti di codifica e il ragionamento migliorato aiutano i grandi refactoring delle basi di codice e i flussi di lavoro di revisione del codice automatizzati.
  • Assistenti di prodotto multimodali: flussi di lavoro immagine + testo + audio (assistenza clienti che acquisisce screenshot, frammenti di chiamata e documenti).
  • Generazione e modifica dei media (foto → video): le precedenti funzionalità della famiglia Gemini ora includono funzionalità foto→video in stile Veo/Flow; l'anteprima suggerisce una generazione multimediale più approfondita per prototipi e flussi di lavoro multimediali.

Come chiamare l'API gemini-3-pro-preview da CometAPI

Anteprima dei prezzi di Gemini 3 Pro su CometAPI, sconto del 20% sul prezzo ufficiale:

Token di input$1.60
Gettoni di uscita$9.60

Passi richiesti

  • Accedere cometapi.comSe non sei ancora un nostro utente, ti preghiamo di registrarti prima.
  • Accedi al tuo Console CometAPI.
  • Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.

API di anteprima di Gemini 3 Pro

Usa il metodo

  1. Selezionare l'opzione "gemini-3-pro-preview"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità.
  2. Sostituire con la tua chiave CometAPI effettiva dal tuo account.
  3. Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
  4. Elaborare la risposta API per ottenere la risposta generata.

CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per la chat:

Vedi anche API GPT-5.1

SHARE THIS BLOG

500+ Modelli in Una API

Fino al 20% di sconto