Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
Eingabe:$1.60/M
Ausgabe:$9.60/M
Kontext:200.0k
Maximale Ausgabe:200.0k
Gemini 3 Pro Preview ist ein Allzweckmodell aus der Gemini-Familie, das als Preview zur Evaluierung und zum Prototyping verfügbar ist. Es unterstützt das Befolgen von Anweisungen, mehrschrittiges Schlussfolgern über mehrere Runden sowie Code- und Datenaufgaben, mit strukturierten Ausgaben und Tool-/Funktionsaufrufen zur Workflow-Automatisierung. Typische Anwendungsfälle sind Chat-Assistenten, Zusammenfassung und Umformulierung, Retrieval-gestützte QA, Datenextraktion und leichtgewichtige Programmierhilfe über Apps und Dienste hinweg. Zu den technischen Highlights gehören API-basierte Bereitstellung, Streaming-Antworten, Sicherheitskontrollen und Integrationsbereitschaft, mit multimodalen Fähigkeiten je nach Preview-Konfiguration.
Überblick
Playground
Funktionen
Preisgestaltung
API
Versionen

Gemini 3 Pro (Preview) ist Googles/DeepMinds neuestes multimodales Flaggschiff-Reasoning-Modell in der Gemini‑3‑Familie. Es wird als ihr „bisher intelligentestes Modell“ positioniert und ist ausgelegt für tiefgehendes Reasoning, agentenbasierte Workflows, fortgeschrittenes Coding und multimodales Verständnis mit langem Kontext (Text, Bilder, Audio, Video, Code und Tool‑Integrationen).

Wichtige Funktionen

  • Modalitäten: Text, Bild, Video, Audio, PDFs (und strukturierte Tool‑Ausgaben).
  • Agentik/Tooling: Integrierter Funktionsaufruf, Suche-als-Tool, Codeausführung, URL-Kontext und Unterstützung für die Orchestrierung mehrstufiger Agenten. Ein Thought‑Signature‑Mechanismus bewahrt mehrschrittiges Reasoning über mehrere Aufrufe hinweg.
  • Coding & „Vibe‑Coding“: Optimiert für Frontend‑Generierung, interaktive UI‑Generierung und agentisches Coding (laut Google führt es die einschlägigen Leaderboards an). Es wird als ihr bislang stärkstes „Vibe‑Coding“-Modell vermarktet.
  • Neue Entwicklersteuerungen: thinking_level (low|high) zum Abwägen von Kosten/Latenz gegenüber Reasoning‑Tiefe sowie media_resolution zur Steuerung der multimodalen Wiedergabetreue pro Bild- bzw. Videoframe. Diese helfen, Performance, Latenz und Kosten auszubalancieren.

Benchmark-Leistung

  • Gemini3Pro belegte in LMARE mit 1501 Punkten den ersten Platz, übertraf Grok-4.1-thinking mit 1484 Punkten und lag auch vor Claude Sonnet 4.5 und Opus 4.1.
  • Ebenfalls Platz eins in der WebDevArena‑Programmierarena mit 1487 Punkten.
  • Im „Humanity’s Last Exam“ (akademisches Reasoning) erreichte es 37.5% (ohne Tools); in GPQA Diamond (Naturwissenschaften) 91.9%; und in der MathArena Apex (Mathematik) 23.4% – ein neuer Rekord.
  • Bei den multimodalen Fähigkeiten erzielte es in MMMU‑Pro 81%; und im Video‑MMMU‑Videoverständnis 87.6%.

Bild

Technische Details & Architektur

  • „Thinking level“-Parameter: Gemini 3 stellt eine thinking_level‑Steuerung bereit, mit der Entwickler die Tiefe des internen Reasonings gegenüber Latenz/Kosten abwägen können. Das Modell behandelt thinking_level als relative Freigabe für internes mehrstufiges Reasoning, nicht als strikte Token‑Garantie. Standard ist bei Pro typischerweise high. Dies ist eine explizite neue Steuergröße, um mehrstufige Planung und Chain‑of‑Thought‑Tiefe zu justieren.
  • Strukturierte Ausgaben & Tools: Das Modell unterstützt strukturierte JSON‑Ausgaben und lässt sich mit integrierten Tools kombinieren (Google Search Grounding, URL‑Kontext, Codeausführung usw.). Einige Funktionen aus Structured‑Output+Tools sind nur in der Vorschau für gemini-3-pro-preview verfügbar.
  • Multimodale und agentische Integrationen: Gemini 3 Pro ist ausdrücklich für agentische Workflows gebaut (Tooling + mehrere Agenten über Code/Terminals/Browser).

Einschränkungen & bekannte Hinweise

  1. Faktentreue nicht perfekt — Halluzinationen sind möglich. Trotz der von Google behaupteten Verbesserungen bei der Faktentreue sind abgesicherte Verifikation und menschliche Prüfung in risikoreichen Szenarien (juristisch, medizinisch, finanziell) weiterhin notwendig.
  2. Langkontextleistung variiert je nach Aufgabe. Unterstützung für ein 1M‑Input‑Fenster ist eine Hard‑Capability, doch die empirische Effektivität kann bei Extremlängen auf einigen Benchmarks abfallen (punktuelle Rückgänge bei 1M in manchen Langkontext‑Tests).
  3. Kosten‑/Latenz‑Abwägungen. Große Kontexte und höhere thinking_level‑Einstellungen erhöhen Rechenaufwand, Latenz und Kosten; Preisstufen richten sich nach Token‑Volumina. Nutzen Sie thinking_level und Chunking‑Strategien zur Kostensteuerung.
  4. Sicherheits‑ & Inhaltsfilter. Google setzt weiterhin Sicherheitsrichtlinien und Moderationsschichten ein; bestimmte Inhalte und Aktionen bleiben eingeschränkt oder lösen Verweigerungsmodi aus.

Vergleich von Gemini 3 Pro Preview mit anderen Spitzenmodellen

Vergleich auf hoher Ebene (Preview → qualitativ):

Gegenüber Gemini 2.5 Pro: Sprunghafte Verbesserungen beim Reasoning, der agentischen Tool‑Nutzung und der multimodalen Integration; deutlich größeres Kontexthandling und besseres Verständnis langer Inhalte. DeepMind zeigt konsistente Zuwächse in akademischem Reasoning, Coding und multimodalen Aufgaben.

Gegenüber GPT-5.1 und Claude Sonnet 4.5 (laut Angaben): Auf Googles/DeepMinds Benchmark‑Slate wird Gemini 3 Pro als führend bei mehreren agentischen, multimodalen und Langkontext‑Metriken präsentiert (siehe Terminal‑Bench, MMMU‑Pro, AIME). Vergleichsergebnisse variieren je nach Aufgabe.


Typische und besonders wertvolle Anwendungsfälle

  • Zusammenfassung großer Dokumente/Bücher & Q&A: Langkontext‑Support macht es attraktiv für Rechts‑, Forschungs‑ und Compliance‑Teams.
  • Code‑Verständnis & ‑Generierung im Repository‑Maßstab: Integration mit Coding‑Toolchains und verbessertes Reasoning unterstützen umfangreiche Refactorings und automatisierte Code‑Review‑Workflows.
  • Multimodale Produktassistenten: Bild + Text + Audio‑Workflows (Kundensupport, der Screenshots, Mitschnitte und Dokumente verarbeitet).
  • Medienerstellung & ‑bearbeitung (Foto → Video): Frühere Gemini‑Familienfunktionen umfassen jetzt Veo‑/Flow‑Style‑Foto→Video‑Fähigkeiten; die Preview deutet auf tiefere Multimedia‑Generierung für Prototypen und Medien‑Workflows hin.

Playground für Gemini 3 Pro Preview

Erkunden Sie Gemini 3 Pro Preview's Playground — eine interaktive Umgebung zum Testen von Modellen und Ausführen von Abfragen in Echtzeit. Probieren Sie Prompts aus, passen Sie Parameter an und iterieren Sie sofort, um die Entwicklung zu beschleunigen und Anwendungsfälle zu validieren.

Funktionen für Gemini 3 Pro Preview

* **Modell-ID (Vorschau):** `gemini-3-pro-preview`. * **Eingabetypen:** Text, Bild, Video, Audio, PDF. Ausgabe: Text * **Kontext-/Token-Grenzen:** Eingabe ≈ **1,048,576 Token**; Ausgabe ≤ **65,536 Token**. * **Wissensstand:** **Januar 2025** (verwendet Search Grounding für neuere Informationen). * **Fähigkeiten (ausgewählt):** Funktionsaufrufe, Codeausführung, Dateisuche, strukturierte Ausgaben, Search Grounding. Nicht unterstützt: Audiogenerierung, Bildgenerierung, Live-API, Bildsegmentierung, Google Maps Grounding (einige Funktionen unterscheiden sich von Gemini 2.5).
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Preise für Gemini 3 Pro Preview

Entdecken Sie wettbewerbsfähige Preise für Gemini 3 Pro Preview, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Gemini 3 Pro Preview Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.
Comet-Preis (USD / M Tokens)Offizieller Preis (USD / M Tokens)
Eingabe:$1.60/M
Ausgabe:$9.60/M
Eingabe:$2.00/M
Ausgabe:$12.00/M

Beispielcode und API für Gemini 3 Pro Preview

Gemini 3 Pro ist das neueste Flaggschiff unter den multimodalen Reasoning-Modellen in der Gemini-3-Familie von Google/DeepMind. Es wird als ihr „bisher intelligentestes Modell“ positioniert und ist ausgelegt für tiefgehendes Reasoning, agentenbasierte Workflows, fortgeschrittenes Programmieren und ein multimodales Verständnis mit langem Kontext (Text, Bilder, Audio, Video, Code und Tool-Integrationen).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versionen von Gemini 3 Pro Preview

Der Grund, warum Gemini 3 Pro Preview mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.