What is the context window and output limit for Gemini 3 Pro?

Gemini 3 Pro supporta una finestra di contesto di input da 1 milione di token con fino a 64,000 token di output, rendendolo ideale per analizzare intere codebase o documenti lunghi.

How does the thinking_level parameter work in Gemini 3 Pro?

Gemini 3 Pro utilizza il ragionamento dinamico per impostazione predefinita. Imposta thinking_level su 'low' per risposte più rapide quando non è necessario un ragionamento complesso, oppure su 'high' (predefinito) per massimizzare la profondità del ragionamento nei compiti complessi.

Does Gemini 3 Pro support Google Search grounding?

Sì, Gemini 3 Pro supporta Google Search grounding, File Search, Code Execution e gli strumenti URL Context. Nota che Google Maps grounding e Computer Use non sono ancora supportati in Gemini 3.

What makes Gemini 3 Pro different from Gemini 2.5 Pro?

Gemini 3 Pro offre miglioramenti progressivi nei flussi di lavoro basati su agenti e nella programmazione autonoma. Utilizza firme di ragionamento per fornire contesto di ragionamento tra le chiamate API e ha un limite di conoscenza a gennaio 2025.

Can Gemini 3 Pro combine structured outputs with built-in tools?

Sì, i modelli Gemini 3 consentono di combinare output strutturati (schema JSON) con strumenti integrati come Google Search, URL Context e Code Execution nella stessa richiesta.

Why should I keep temperature at 1.0 for Gemini 3 Pro?

Google consiglia vivamente di mantenere temperature al valore predefinito 1.0. Valori più bassi possono causare cicli imprevisti o prestazioni degradate in compiti matematici e di ragionamento complesso.

What are thought signatures and why are they important?

Le firme di ragionamento sono rappresentazioni crittografate del ragionamento interno del modello. Per le chiamate di funzione sono applicate rigorosamente—l'assenza di firme restituisce errori 400. Gli SDK ufficiali le gestiscono automaticamente.

API Gemini 3 Pro Conveniente | text-to-text

Gemini 3 Pro (Preview) è il più recente modello multimodale di ragionamento di punta di Google/DeepMind nella famiglia Gemini 3. È presentato come “il loro modello più intelligente di sempre”, progettato per il ragionamento profondo, workflow basati su agenti, coding avanzato e comprensione multimodale a lungo contesto (testo, immagini, audio, video, codice e integrazioni con strumenti).

Caratteristiche principali

Modalità: Testo, immagine, video, audio, PDF (e output strutturati degli strumenti).
Agenti/strumentazione: Function calling integrato, search-as-tool, esecuzione di codice, contesto URL e supporto all’orchestrazione di agenti multi-step. Un meccanismo di thought-signature preserva il ragionamento multi-step tra le chiamate.
Coding e “vibe coding”: Ottimizzato per la generazione front-end, la generazione di UI interattive e il coding basato su agenti (è in cima alle classifiche pertinenti riportate da Google). È commercializzato come il loro modello di “vibe coding” più potente finora.
Nuovi controlli per sviluppatori: thinking_level (low|high) per bilanciare costo/latenza rispetto alla profondità del ragionamento, e media_resolution per controllare la fedeltà multimodale per immagine o fotogramma video. Questi aiutano a bilanciare prestazioni, latenza e costi.

Prestazioni nei benchmark

Gemini3Pro ha ottenuto il primo posto in LMARE con un punteggio di 1501, superando i 1484 punti di Grok-4.1-thinking e precedendo anche Claude Sonnet 4.5 e Opus 4.1.
Ha ottenuto anche il primo posto nell’arena di programmazione WebDevArena con un punteggio di 1487.
In Humanity’s Last Exam (ragionamento accademico) ha raggiunto il 37.5% (senza strumenti); in GPQA Diamond (scienze), il 91.9%; e nella competizione matematica MathArena Apex, il 23.4%, stabilendo un nuovo record.
Per le capacità multimodali, MMMU-Pro ha raggiunto l’81%; e nella comprensione video di Video-MMMU, l’87.6%.

Dettagli tecnici e architettura

Parametro “Thinking level”: Gemini 3 espone un controllo thinking_level che consente agli sviluppatori di bilanciare la profondità del ragionamento interno rispetto a latenza/costo. Il modello tratta thinking_level come un margine relativo per il ragionamento interno multi-step, non come una garanzia rigorosa di token. Il valore predefinito è tipicamente high per Pro. Questo è un nuovo controllo esplicito per regolare la pianificazione multi-step e la profondità della chain-of-thought.
Output strutturati e strumenti: Il modello supporta output JSON strutturati e può essere combinato con strumenti integrati (Google Search grounding, contesto URL, esecuzione di codice, ecc.). Alcune funzionalità di output strutturati+strumenti sono disponibili solo in anteprima per gemini-3-pro-preview.
Integrazioni multimodali e agentiche: Gemini 3 Pro è esplicitamente costruito per workflow basati su agenti (strumentazione + più agenti su codice/terminali/browser).

Limitazioni e avvertenze note

Fattualità non perfetta — sono ancora possibili allucinazioni. Nonostante i miglioramenti nella fattualità dichiarati da Google, la verifica basata su fonti e la revisione umana restano necessarie in contesti ad alto impatto (legale, medico, finanziario).
Prestazioni su contesti lunghi variabili in base al compito. Il supporto per una finestra di input da 1M è una capacità consolidata, ma l’efficacia empirica può diminuire su alcuni benchmark a lunghezze estreme (si sono osservati cali puntuali a 1M in alcuni test di lungo contesto).
Compromessi tra costi e latenza. Contesti ampi e impostazioni thinking_level più alte aumentano il calcolo, la latenza e i costi; si applicano fasce di prezzo in base ai volumi di token. Usa thinking_level e strategie di suddivisione in chunk per gestire i costi.
Sicurezza e filtri sui contenuti. Google continua ad applicare policy di sicurezza e livelli di moderazione; alcuni contenuti e azioni restano limitati o innescano modalità di rifiuto.

Confronto tra Gemini 3 Pro Preview e altri modelli al top

Confronto ad alto livello (anteprima → qualitativo):

Rispetto a Gemini 2.5 Pro: Miglioramenti di salto di livello nel ragionamento, nell’uso agentico degli strumenti e nell’integrazione multimodale; gestione di contesti molto più grandi e migliore comprensione dei contenuti lunghi. DeepMind mostra progressi costanti in ragionamento accademico, coding e attività multimodali.

Rispetto a GPT-5.1 e Claude Sonnet 4.5 (secondo quanto riportato): Sulla suite di benchmark di Google/DeepMind, Gemini 3 Pro è presentato come leader su diverse metriche agentiche, multimodali e di lungo contesto (vedi Terminal-Bench, MMMU-Pro, AIME). I risultati comparativi variano in base al compito.

Casi d’uso tipici e ad alto valore

Riepilogo/Q&A su grandi documenti/libri: il supporto a contesti lunghi lo rende attraente per team legali, di ricerca e compliance.
Comprensione e generazione di codice a scala repository: l’integrazione con toolchain di coding e il ragionamento migliorato aiutano i refactor di grandi basi di codice e workflow di code review automatizzata.
Assistenti di prodotto multimodali: workflow immagine + testo + audio (assistenza clienti che elabora screenshot, estratti di chiamate e documenti).
Generazione ed editing di media (foto → video): funzionalità precedenti della famiglia Gemini ora includono capacità in stile Veo/Flow foto→video; l’anteprima suggerisce una generazione multimediale più profonda per prototipi e workflow media.

Come accedere all’API Gemini 3 Pro

Passaggio 1: Registrati per la chiave API

Accedi a cometapi.com. Se non sei ancora un nostro utente, registrati prima. Accedi alla tua CometAPI console. Ottieni la chiave API di accesso dell’interfaccia. Fai clic su “Add Token” nella voce API token del centro personale, ottieni la chiave del token: sk-xxxxx e invia.

Passaggio 2: Invia richieste all’API Gemini 3 Pro

Seleziona l’endpoint “gemini-3-pro” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta sono riportati nella documentazione API sul nostro sito web. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva dal tuo account. La base url è Gemini Generating Content e Chat

Inserisci la tua domanda o richiesta nel campo content—è ciò a cui il modello risponderà. Elabora la risposta dell’API per ottenere la risposta generata.

Passaggio 3: Recupera e verifica i risultati

Elabora la risposta dell’API per ottenere la risposta generata. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.

Model family	Variant (model name)	Input price (USD / 1M tokens)	Output price (USD / 1M tokens)
gemini-3-pro	gemini-3-pro-preview	$1.60	$9.60
gemini-3-pro	gemini-3-pro-preview-thinking	$1.60	$9.60
gemini-3-pro	gemini-3-pro-all	$1.60	$9.60

ID modello	Descrizione	Disponibilità	Richiesta
gemini-3-pro-all	La tecnologia utilizzata non è ufficiale e la generazione è instabile, ecc.	✅	Chat formato
gemini-3-pro	Consigliato, indirizza al modello più recente	❌	Gemini Generating Content
gemini-3-pro-preview	Anteprima ufficiale	❌	Gemini Generating Content

Gemini 3 Pro