Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
Entrada:$1.60/M
Salida:$9.60/M
Contexto:200.0k
Salida Máxima:200.0k
Gemini 3 Pro Preview es un modelo de propósito general de la familia Gemini, disponible en versión preliminar para evaluación y creación de prototipos. Admite el seguimiento de instrucciones, el razonamiento en múltiples turnos y tareas de código y datos, con resultados estructurados y llamadas a herramientas/funciones para la automatización de flujos de trabajo. Los usos típicos incluyen asistentes de chat, resumen y reescritura, preguntas y respuestas con recuperación aumentada, extracción de datos y asistencia ligera de programación en aplicaciones y servicios. Entre los aspectos técnicos destacados se incluyen el despliegue basado en API, respuestas en streaming, controles de seguridad y preparación para la integración, con capacidades multimodales según la configuración de la versión preliminar.
Resumen
Playground
Características
Precios
API
Versiones

Gemini 3 Pro (Preview) es el nuevo modelo insignia de razonamiento multimodal de Google/DeepMind dentro de la familia Gemini 3. Se presenta como su “modelo más inteligente hasta la fecha”, diseñado para razonamiento profundo, flujos de trabajo con agentes, programación avanzada y comprensión multimodal de largo contexto (texto, imágenes, audio, video, código e integraciones con herramientas).

Características clave

  • Modalidades: Texto, imagen, video, audio, PDF (y salidas estructuradas de herramientas).
  • Agentes/herramientas: Llamadas a funciones integradas, búsqueda como herramienta, ejecución de código, contexto de URL y compatibilidad para orquestar agentes de múltiples pasos. El mecanismo de thought-signature preserva el razonamiento de múltiples pasos entre llamadas.
  • Programación y “vibe coding”: Optimizado para generación de front-end, generación de interfaces de usuario interactivas y programación con agentes (encabeza tablas de clasificación relevantes reportadas por Google). Se promociona como su modelo de “vibe coding” más potente hasta la fecha.
  • Nuevos controles para desarrolladores: thinking_level (low|high) para equilibrar costo/latencia frente a profundidad de razonamiento, y media_resolution para controlar la fidelidad multimodal por imagen o fotograma de video. Estos ayudan a equilibrar rendimiento, latencia y costo.

Rendimiento en benchmarks

  • Gemini3Pro obtuvo el primer lugar en LMARE con una puntuación de 1501, superando los 1484 puntos de Grok-4.1-thinking y también por delante de Claude Sonnet 4.5 y Opus 4.1.
  • También logró el primer lugar en el arena de programación WebDevArena con una puntuación de 1487.
  • En Humanity’s Last Exam (razonamiento académico), alcanzó 37.5% (sin herramientas); en GPQA Diamond (ciencia), 91.9%; y en la competencia de matemáticas MathArena Apex, 23.4%, estableciendo un nuevo récord.
  • En capacidades multimodales, MMMU-Pro alcanzó 81%; y en comprensión de video de Video-MMMU, 87.6%.

imagen

Detalles técnicos y arquitectura

  • Parámetro “thinking level”: Gemini 3 expone un control thinking_level que permite a los desarrolladores equilibrar profundidad de razonamiento interno frente a latencia/costo. El modelo trata thinking_level como una asignación relativa para el razonamiento interno de múltiples pasos, no como una garantía estricta de tokens. El valor predeterminado suele ser high para Pro. Es un control explícito para ajustar la planificación de múltiples pasos y la profundidad de la chain-of-thought.
  • Salidas estructuradas y herramientas: El modelo admite salidas JSON estructuradas y puede combinarse con herramientas integradas (vinculación con Google Search, contexto de URL, ejecución de código, etc.). Algunas funciones de salidas estructuradas + herramientas están disponibles solo en vista previa para gemini-3-pro-preview.
  • Integraciones multimodales y con agentes: Gemini 3 Pro está diseñado explícitamente para flujos de trabajo con agentes (herramientas + múltiples agentes sobre código/terminales/navegador).

Limitaciones y advertencias conocidas

  1. Factualidad no perfecta: siguen siendo posibles alucinaciones. A pesar de las mejoras en factualidad reportadas por Google, la verificación con base y la revisión humana siguen siendo necesarias en entornos de alto riesgo (legal, médico, financiero).
  2. El rendimiento en contexto largo varía según la tarea. La compatibilidad con una ventana de entrada de 1M es una capacidad firme, pero la efectividad empírica puede disminuir en algunos benchmarks a longitudes extremas (se han observado descensos puntuales a 1M en algunas pruebas de contexto largo).
  3. Compromisos de costo y latencia. Contextos grandes y configuraciones más altas de thinking_level aumentan cómputo, latencia y costo; se aplican niveles de precios según volúmenes de tokens. Usa thinking_level y estrategias de fragmentación para gestionar costos.
  4. Seguridad y filtros de contenido. Google continúa aplicando políticas de seguridad y capas de moderación; cierto contenido y acciones siguen restringidos o activarán modos de rechazo.

Cómo se compara Gemini 3 Pro Preview con otros modelos de primer nivel

Comparación de alto nivel (preview → cualitativa):

Frente a Gemini 2.5 Pro: Mejoras de salto en razonamiento, uso de herramientas con agentes e integración multimodal; manejo de contextos mucho más grandes y mejor comprensión de textos largos. DeepMind muestra avances constantes en razonamiento académico, programación y tareas multimodales.

Frente a GPT-5.1 y Claude Sonnet 4.5 (según lo reportado): En el conjunto de benchmarks de Google/DeepMind, Gemini 3 Pro se presenta como líder en varias métricas de agentes, multimodalidad y contexto largo (ver Terminal-Bench, MMMU-Pro, AIME). Los resultados comparativos varían según la tarea.


Casos de uso típicos y de alto valor

  • Resumen de documentos / libros y Q&A: El soporte de contexto largo lo hace atractivo para equipos legales, de investigación y de cumplimiento normativo.
  • Comprensión y generación de código a escala de repositorio: La integración con cadenas de herramientas de programación y el razonamiento mejorado ayuda en refactors de grandes bases de código y flujos de revisión de código automatizados.
  • Asistentes de producto multimodales: Flujos de trabajo de imagen + texto + audio (atención al cliente que ingiere capturas de pantalla, fragmentos de llamadas y documentos).
  • Generación y edición de medios (foto → video): Las funciones anteriores de la familia Gemini ahora incluyen capacidades de foto→video estilo Veo / Flow; la vista previa sugiere una generación multimedia más profunda para prototipos y flujos de trabajo de medios.

Playground para Gemini 3 Pro Preview

Explora el Playground de Gemini 3 Pro Preview — un entorno interactivo para probar modelos y ejecutar consultas en tiempo real. Prueba prompts, ajusta parámetros e itera instantáneamente para acelerar el desarrollo y validar casos de uso.

Características para Gemini 3 Pro Preview

* **ID del modelo (vista previa):** `gemini-3-pro-preview`. * **Tipos de entrada:** Texto, Imagen, Vídeo, Audio, PDF. Salida: Texto * **Límites de contexto / tokens:** Entrada ≈ **1,048,576 tokens**; Salida ≤ **65,536 tokens**. * **Fecha de corte de conocimientos:** **enero de 2025** (usa Search Grounding para información más reciente). * **Capacidades (seleccionadas):** llamadas a funciones, ejecución de código, búsqueda de archivos, salidas estructuradas, Search Grounding. No admite: generación de audio, generación de imágenes, API en tiempo real, segmentación de imágenes, Google Maps grounding (algunas funciones difieren de Gemini 2.5).
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Precios para Gemini 3 Pro Preview

Explora precios competitivos para Gemini 3 Pro Preview, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo Gemini 3 Pro Preview puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)Precio Oficial (USD / M Tokens)
Entrada:$1.60/M
Salida:$9.60/M
Entrada:$2.00/M
Salida:$12.00/M

Código de ejemplo y API para Gemini 3 Pro Preview

Gemini 3 Pro es el modelo insignia más reciente de razonamiento multimodal de Google/DeepMind dentro de la familia Gemini 3. Se presenta como su “modelo más inteligente hasta la fecha”, diseñado para el razonamiento profundo, flujos de trabajo basados en agentes, programación avanzada y comprensión multimodal de contexto largo (texto, imágenes, audio, video, código e integraciones con herramientas).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versiones de Gemini 3 Pro Preview

La razón por la cual Gemini 3 Pro Preview tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.