Especificaciones técnicas — Gemini 3.1 Pro
| Elemento | gemini-3-pro (resumen público) |
|---|---|
| Proveedor | |
| ID de modelo canónico | gemini-3-pro (vista previa pública) |
| Tipos de entrada | Texto, Imagen, Video, Audio, PDF |
| Tipos de salida | Texto (lenguaje natural, salidas estructuradas, payloads de llamadas a funciones) |
| Límite de tokens de entrada (contexto) | 1,048,576 tokens |
| Límite de tokens de salida | 65,536 tokens |
| Llamada a funciones / uso de herramientas | Compatible (llamadas a funciones, salidas estructuradas, integraciones de herramientas) |
| Multimodalidad | Soporte multimodal completo (imágenes, video, audio, documentos) |
| Ejecución de código y flujos agénticos | Compatible (modo agente, asistencia de código, orquestación de herramientas) |
| Fecha de corte de conocimientos | enero de 2025 |
¿Qué es Gemini 3.1 Pro?
Gemini 3.1 Pro es el buque insignia público de Google en la familia Gemini 3, posicionado como un modelo de razonamiento multimodal de última generación con herramientas avanzadas agénticas y para desarrolladores. El modelo enfatiza el manejo de contexto de alta capacidad (entradas de más de 1M tokens), amplio soporte de medios (imágenes, video, audio, PDF) e integraciones profundas para el uso de herramientas, llamadas a funciones y flujos centrados en código (p. ej., Gemini Code Assist y modos de agente).
Gemini 3 Pro es presentado por Google como optimizado tanto para experiencias interactivas de desarrolladores (codificación de baja latencia y flujos de trabajo de agentes) como para una comprensión multimodal de alta fidelidad (interpretación y razonamiento a través de entradas de medios mixtos).
Características principales de Gemini 3.1 Pro
Gemini-3.1 Pro (a través de su vista previa) introduce las siguientes características:
Integración multimodal
Procesa entradas en:
- Lenguaje natural
- Imágenes
- Habla/audio
- Video
con una representación unificada de tokens para el razonamiento entre modalidades.
Ventana de contexto ampliada
Una capacidad de contexto excepcionalmente grande de hasta ~1 millón de tokens permite manejar:
- Documentos extensos
- Síntesis multidocumento
- Bases de código y transcripciones.
Esto supera a muchos modelos competidores que normalmente admiten ~32 K–262 K tokens.
Escalado con mezcla dispersa de expertos (MoE)
El enrutamiento MoE disperso permite escalar la capacidad interna del modelo sin costes computacionales proporcionales, mejorando el razonamiento a escala.
Razonamiento / planificación avanzados
Innovaciones como el entrenamiento de cadena de pensamiento, el aprendizaje por refuerzo a partir de retroalimentación humana y evaluaciones comparativas especializadas lo hacen fuerte en tareas lógicas y matemáticas.
Supuestos benchmarks:
AIME 2025: 100% (con ejecución de código)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
Casos de uso empresariales representativos
- Canalizaciones multimedia de extremo a extremo: Ingerir video, transcripción e imágenes para producir resúmenes sincronizados, metadatos e información estructurada a escala.
- Generación y revisión de código a gran escala: Uso en IDE y canalizaciones de CI para autogenerar código, refactorizar proyectos con múltiples archivos y producir sugerencias de pruebas en grandes bases de código.
- Automatización basada en agentes: Coordinar agentes con múltiples herramientas que interactúan con servicios en la nube, sistemas de orquestación y API internas mediante llamadas a funciones estructuradas.
- Investigación y producción de contenido: Redactar contenido de formato largo (informes, libros) que combine texto y multimedia incrustado conservando las referencias cruzadas internas.
Cómo acceder a la API de Gemini 3.1 Pro
Paso 1: Regístrate para obtener una clave de API
Inicia sesión en cometapi.com. Si aún no eres usuario, regístrate primero. Inicia sesión en tu Consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de API del centro personal, obtén la clave de token: sk-xxxxx y envíala.
Paso 2: Envía solicitudes a la API de Gemini 3.1 Pro
Selecciona el endpoint “gemini-3.1-pro” para enviar la solicitud de API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también proporciona pruebas en Apifox para tu comodidad. Reemplaza <YOUR_API_KEY> con tu clave real de CometAPI de tu cuenta. La URL base es Gemini Generating Content y Chat.
Inserta tu pregunta o solicitud en el campo de contenido—esto es a lo que responderá el modelo. Procesa la respuesta de la API para obtener la respuesta generada.
Paso 3: Recupera y verifica los resultados
Procesa la respuesta de la API para obtener la respuesta generada. Después del procesamiento, la API responde con el estado de la tarea y los datos de salida.
Consulta también Gemini 3 Pro API