Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
Ingresso:$1.60/M
Uscita:$9.60/M
Contesto:200.0k
Uscita Massima:200.0k
Gemini 3 Pro Preview è un modello di uso generale della famiglia Gemini, disponibile in anteprima per valutazione e prototipazione. Supporta il rispetto delle istruzioni, il ragionamento multi-turno e attività su codice e dati, con output strutturati e invocazione di strumenti/funzioni per l’automazione dei flussi di lavoro. Gli usi tipici includono assistenti di chat, sintesi e riscrittura, domande e risposte potenziate dal recupero, estrazione di dati e supporto leggero alla programmazione nelle app e nei servizi. Tra le caratteristiche tecniche principali figurano la distribuzione tramite API, risposte in streaming, controlli di sicurezza e predisposizione all’integrazione, con capacità multimodali a seconda della configurazione dell’anteprima.
Panoramica
Playground
Caratteristiche
Prezzi
API
Versioni

Gemini 3 Pro (Preview) è il nuovo modello di punta multimodale per il ragionamento di Google/DeepMind nella famiglia Gemini 3. È presentato come “il loro modello più intelligente di sempre”, progettato per ragionamento profondo, flussi di lavoro basati su agenti, coding avanzato e comprensione multimodale su contesti estesi (testo, immagini, audio, video, codice e integrazioni con strumenti).

Caratteristiche principali

  • Modalità: Testo, immagine, video, audio, PDF (e output strutturati di strumenti).
  • Agenti/strumentazione: Function calling integrato, search-as-tool, esecuzione di codice, contesto da URL e supporto per orchestrare agenti a più passaggi. Il meccanismo di thought-signature preserva il ragionamento multi-step tra le chiamate.
  • Coding e “vibe coding”: Ottimizzato per generazione front-end, generazione di interfacce utente interattive e coding basato su agenti (primeggia nelle classifiche pertinenti riportate da Google). È pubblicizzato come il loro modello “vibe-coding” più potente di sempre.
  • Nuovi controlli per sviluppatori: thinking_level (low|high) per bilanciare costo/latenza rispetto alla profondità di ragionamento, e media_resolution per controllare la fedeltà multimodale per immagine o frame video. Questi aiutano a bilanciare prestazioni, latenza e costi.

Prestazioni nei benchmark

  • Gemini3Pro ha ottenuto il primo posto in LMARE con un punteggio di 1501, superando i 1484 punti di Grok-4.1-thinking e precedendo anche Claude Sonnet 4.5 e Opus 4.1.
  • Ha ottenuto il primo posto anche nell’arena di programmazione WebDevArena con un punteggio di 1487.
  • In Humanity’s Last Exam (ragionamento accademico) ha raggiunto il 37.5% (senza strumenti); in GPQA Diamond (scienze) il 91.9%; e nella competizione matematica MathArena Apex il 23.4%, stabilendo un nuovo record.
  • Nelle capacità multimodali, MMMU-Pro ha raggiunto l’81%; e in Video-MMMU (comprensione video) l’87.6%.

img

Dettagli tecnici e architettura

  • Parametro “Thinking level”: Gemini 3 espone un controllo thinking_level che consente agli sviluppatori di bilanciare profondità del ragionamento interno rispetto a latenza/costo. Il modello interpreta thinking_level come un margine relativo per il ragionamento interno a più passaggi, non come una garanzia rigorosa di token. Il valore predefinito è tipicamente high per Pro. Si tratta di un nuovo controllo esplicito per modulare pianificazione multi-step e profondità della chain-of-thought.
  • Output strutturati e strumenti: Il modello supporta output JSON strutturati e può essere combinato con strumenti integrati (ancoraggio alla ricerca Google, contesto da URL, esecuzione di codice, ecc.). Alcune funzioni di output strutturato + strumenti sono disponibili solo in anteprima per gemini-3-pro-preview.
  • Integrazioni multimodali e basate su agenti: Gemini 3 Pro è esplicitamente costruito per flussi di lavoro basati su agenti (strumentazione + più agenti su codice/terminali/browser).

Limitazioni e avvertenze note

  1. Accuratezza fattuale non perfetta — le allucinazioni sono ancora possibili. Nonostante i miglioramenti rivendicati da Google, verifiche fondate e revisione umana restano necessarie in contesti ad alto impatto (legale, medico, finanziario).
  2. Prestazioni su contesti lunghi variabili per task. Il supporto a una finestra di input da 1M è una capacità concreta, ma l’efficacia empirica può calare su alcuni benchmark a lunghezze estreme (osservati cali puntuali a 1M in alcuni test di lungo contesto).
  3. Trade-off tra costi e latenza. Contesti ampi e impostazioni thinking_level elevate aumentano calcolo, latenza e costi; si applicano fasce di prezzo in base ai volumi di token. Usare thinking_level e strategie di suddivisione per gestire i costi.
  4. Sicurezza e filtri dei contenuti. Google continua ad applicare policy di sicurezza e livelli di moderazione; alcuni contenuti e azioni restano limitati o attivano modalità di rifiuto.

Confronto di Gemini 3 Pro Preview con altri modelli di punta

Confronto ad alto livello (anteprima → qualitativo):

Contro Gemini 2.5 Pro: Miglioramenti netti nel ragionamento, nell’uso di strumenti basati su agenti e nell’integrazione multimodale; gestione di contesti molto più ampi e migliore comprensione di testi lunghi. DeepMind mostra progressi costanti in ragionamento accademico, coding e compiti multimodali.

Contro GPT-5.1 e Claude Sonnet 4.5 (come riportato): Sulla batteria di benchmark di Google/DeepMind, Gemini 3 Pro è presentato come leader in diverse metriche agentiche, multimodali e di lungo contesto (vedi Terminal-Bench, MMMU-Pro, AIME). I risultati comparativi variano a seconda del task.


Casi d’uso tipici e ad alto valore

  • Sintesi di grandi documenti/libri e Q&A: il supporto a contesti lunghi lo rende attraente per team legali, di ricerca e compliance.
  • Comprensione e generazione di codice alla scala di un repo: integrazione con toolchain di sviluppo e ragionamento migliorato agevolano refactoring di grandi codebase e flussi di revisione del codice automatizzati.
  • Assistenti di prodotto multimodali: flussi di lavoro immagine + testo + audio (assistenza clienti che ingerisce screenshot, estratti di chiamate e documenti).
  • Generazione e editing di media (foto → video): funzionalità precedenti della famiglia Gemini includono ora capacità photo→video in stile Veo / Flow; l’anteprima suggerisce una generazione multimediale più profonda per prototipi e flussi media.

Playground per Gemini 3 Pro Preview

Esplora il Playground di Gemini 3 Pro Preview — un ambiente interattivo per testare modelli ed eseguire query in tempo reale. Prova prompt, regola parametri e itera istantaneamente per accelerare lo sviluppo e convalidare i casi d'uso.

Funzionalità per Gemini 3 Pro Preview

* **ID modello (anteprima):** `gemini-3-pro-preview`. * **Tipi di input:** Testo, Immagine, Video, Audio, PDF. Output: Testo * **Limiti di contesto / token:** Input ≈ **1,048,576 token**; Output ≤ **65,536 token**. * **Limite di conoscenza:** **gennaio 2025** (usa Search Grounding per informazioni più recenti). * **Funzionalità (selezionate):** chiamate di funzione, esecuzione del codice, ricerca di file, output strutturati, Search Grounding. Non supportate: generazione audio, generazione di immagini, API live, segmentazione di immagini, Google Maps grounding (alcune funzionalità differiscono da Gemini 2.5).
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Prezzi per Gemini 3 Pro Preview

Esplora i prezzi competitivi per Gemini 3 Pro Preview, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come Gemini 3 Pro Preview può migliorare i tuoi progetti mantenendo i costi gestibili.
Prezzo Comet (USD / M Tokens)Prezzo Ufficiale (USD / M Tokens)
Ingresso:$1.60/M
Uscita:$9.60/M
Ingresso:$2.00/M
Uscita:$12.00/M

Codice di esempio e API per Gemini 3 Pro Preview

Gemini 3 Pro è il più recente modello di ragionamento multimodale di punta di Google/DeepMind nella famiglia Gemini 3. È presentato come il loro “modello più intelligente di sempre”, progettato per il ragionamento profondo, flussi di lavoro basati su agenti, programmazione avanzata e comprensione multimodale a contesto esteso (testo, immagini, audio, video, codice e integrazioni con strumenti).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versioni di Gemini 3 Pro Preview

Il motivo per cui Gemini 3 Pro Preview dispone di più snapshot può includere fattori potenziali come variazioni nell'output dopo aggiornamenti che richiedono snapshot precedenti per coerenza, offrire agli sviluppatori un periodo di transizione per l'adattamento e la migrazione, e diversi snapshot corrispondenti a endpoint globali o regionali per ottimizzare l'esperienza utente. Per le differenze dettagliate tra le versioni, si prega di fare riferimento alla documentazione ufficiale.