API de vista previa de Gemini 3 Pro

CometAPI
AnnaDec 10, 2025
API de vista previa de Gemini 3 Pro

Gemini 3 Pro (Preview) es el modelo de razonamiento multimodal insignia más reciente de Google/DeepMind en la familia Gemini 3. Se posiciona como su “modelo más inteligente hasta la fecha”, diseñado para el razonamiento profundo, flujos de trabajo automatizados, codificación avanzada y comprensión multimodal de largo contexto (texto, imágenes, audio, video, código e integraciones de herramientas).

Características principales

  • Modalidades: Texto, imagen, vídeo, audio, archivos PDF (y salidas estructuradas de herramientas).
  • Agentes/herramientas: Funciones integradas, búsqueda como herramienta, ejecución de código, contexto de URL y soporte para la orquestación de agentes de varios pasos. El mecanismo de firma de pensamiento preserva el razonamiento de varios pasos entre llamadas.
  • **Programación y “programación vibracional”**Optimizado para la generación de interfaces de usuario, la generación de interfaces interactivas y la codificación agentiva (lidera las clasificaciones relevantes de Google). Se comercializa como su modelo de "codificación basada en la experiencia" más potente hasta la fecha.
  • Nuevos controles para desarrolladores: thinking_level (bajo|alto) para equilibrar coste/latencia frente a profundidad de razonamiento, y media_resolution Controla la fidelidad multimodal por imagen o fotograma de vídeo. Esto ayuda a equilibrar el rendimiento, la latencia y el coste.

Rendimiento de referencia

  • El Gemini3Pro logró el primer lugar en LMARE con una puntuación de 1501, superando los 1484 puntos de Grok-4.1-thinking y liderando también a Claude Sonnet 4.5 y Opus 4.1.
  • También logró el primer lugar en la arena de programación WebDevArena con una puntuación de 1487.
  • En el razonamiento académico de Humanity's Last Exam, logró un 37.5% (sin herramientas); en ciencias GPQA Diamond, un 91.9%; y en la competencia matemática MathArena Apex, un 23.4%, estableciendo un nuevo récord.
  • En capacidades multimodales, el MMMU-Pro alcanzó el 81%; y en comprensión de vídeo Video-MMMU, el 87.6%.

API de vista previa de Gemini 3 Pro

Detalles técnicos y arquitectura

  • Parámetro “nivel de pensamiento”: Gemini 3 expone un thinking_level control que permite a los desarrolladores equilibrar la profundidad del razonamiento interno con la latencia/coste. El modelo trata thinking_level como una tolerancia relativa para el razonamiento interno en varios pasos, en lugar de una garantía estricta de tokens. El valor predeterminado suele ser high Para la versión Pro. Se trata de un nuevo control explícito para que los desarrolladores ajusten la planificación en varios pasos y la profundidad de la cadena de pensamiento.
  • Salidas y herramientas estructuradas: El modelo admite Salidas JSON estructuradas y se puede combinar con herramientas integradas (base de datos de la Búsqueda de Google, contexto de URL, ejecución de código, etc.). Algunas funciones de salida estructurada + herramientas solo están disponibles en versión preliminar. gemini-3-pro-preview.
  • Integraciones multimodales y agentivas: Gemini 3 Pro está diseñado específicamente para flujos de trabajo con agentes (herramientas + múltiples agentes a través de código/terminales/navegador).
  • Acepta entradas de texto, imagen, vídeo, audio y PDF; salida de texto.

Limitaciones y advertencias conocidas

  1. No es una información totalmente veraz; las alucinaciones siguen siendo posibles. A pesar de las importantes mejoras en la veracidad que afirma Google, la verificación basada en hechos y la revisión humana siguen siendo necesarias en entornos de alto riesgo (legal, médico, financiero).
  2. El rendimiento en contextos largos varía según la tarea. El soporte para una ventana de entrada de 1M es una capacidad difícil de alcanzar, pero la efectividad empírica puede disminuir en algunos puntos de referencia en longitudes extremas (se observaron disminuciones puntuales a 1M en algunas pruebas de contexto largo).
  3. Compensaciones entre coste y latencia. Contextos amplios y superiores thinking_level La configuración aumenta la capacidad de cómputo, la latencia y el costo; se aplican niveles de precios según el volumen de tokens. Usar thinking_level y estrategias de segmentación para gestionar los costes.
  4. Filtros de seguridad y contenido. Google continúa aplicando políticas de seguridad y capas de moderación; ciertos contenidos y acciones siguen restringidos o activarán modos de rechazo.

Cómo se compara la vista previa del Gemini 3 Pro con otros modelos de gama alta

Comparación de alto nivel (vista previa → cualitativa):

Contra Gemini 2.5 Pro: Mejoras sustanciales en el razonamiento, el uso de herramientas de análisis y la integración multimodal; manejo de contextos mucho más amplios y mejor comprensión de textos extensos. DeepMind muestra avances consistentes en razonamiento académico, codificación y tareas multimodales.

Frente a GPT-5.1 y Claude Sonnet 4.5 (según lo informado): En la plataforma de pruebas comparativas de Google/DeepMind, Gemini 3 Pro se presenta como líder en varias métricas de análisis de agentes, multimodales y de contexto prolongado (véase Terminal-Bench, MMMU-Pro, AIME). Los resultados comparativos varían según la tarea.


Casos de uso típicos y de alto valor

  • Resumen y preguntas y respuestas de documentos/libros extensos: Su compatibilidad con contextos extensos lo hace atractivo para equipos legales, de investigación y de cumplimiento normativo.
  • Comprensión y generación de código a escala de repositorio: La integración con cadenas de herramientas de codificación y la mejora del razonamiento ayudan a refactorizar grandes bases de código y a automatizar los flujos de trabajo de revisión de código.
  • Asistentes de producto multimodales: Flujos de trabajo de imagen + texto + audio (soporte al cliente que ingiere capturas de pantalla, fragmentos de llamadas y documentos).
  • Generación y edición de medios (foto → vídeo): Las funciones anteriores de la familia Gemini ahora incluyen capacidades de foto→video al estilo Veo/Flow; la vista previa sugiere una generación multimedia más profunda para prototipos y flujos de trabajo de medios.

Cómo llamar a la API gemini-3-pro-preview desde CometAPI

Precios de la versión preliminar del Gemini 3 Pro en CometAPI, con un 20 % de descuento sobre el precio oficial:

Tokens de entrada$1.60
Fichas de salida$9.60

Pasos requeridos

  • Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
  • Accede a tu Consola CometAPI.
  • Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.

API de vista previa de Gemini 3 Pro

Método de uso

  1. Seleccione la opción "**gemini-3-pro-preview**Punto final para enviar la solicitud de API y configurar el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad.
  2. Reemplazar con su clave CometAPI real de su cuenta.
  3. Inserte su pregunta o solicitud en el campo de contenido: esto es lo que responderá el modelo.
  4. . Procesa la respuesta de la API para obtener la respuesta generada.

CometAPI proporciona una API REST totalmente compatible para una migración sin problemas. Detalles clave para chatear:

Vea también API GPT-5.1

SHARE THIS BLOG

500+ Modelos en Una API

Hasta 20% de Descuento