Especificaciones técnicas — Gemini 3.1 Pro
| Elemento | gemini-3-pro (resumen público) |
|---|---|
| Proveedor | |
| ID de modelo canónico | gemini-3-pro (vista previa pública) |
| Tipos de entrada | Texto, Imagen, Video, Audio, PDF |
| Tipos de salida | Texto (lenguaje natural, salidas estructuradas, cargas útiles de llamadas a funciones) |
| Límite de tokens de entrada (contexto) | 1,048,576 tokens |
| Límite de tokens de salida | 65,536 tokens |
| Llamadas a funciones / uso de herramientas | Compatible (llamadas a funciones, salidas estructuradas, integraciones de herramientas) |
| Multimodalidad | Compatibilidad multimodal completa (imágenes, video, audio, documentos) |
| Ejecución de código y flujos agénticos | Compatible (modo de agente, asistencia de código, orquestación de herramientas) |
| Fecha de corte de conocimientos | enero de 2025 |
¿Qué es Gemini 3.1 Pro?
Gemini 3.1 Pro es el buque insignia público de Google dentro de la familia Gemini 3, posicionado como un modelo de razonamiento multimodal de última generación con herramientas avanzadas para agentes y desarrolladores. El modelo enfatiza el manejo de contexto de gran capacidad (entradas de más de 1M de tokens), un amplio soporte de medios (imágenes, video, audio, PDF) e integraciones profundas para el uso de herramientas, las llamadas a funciones y los flujos de trabajo centrados en el código (p. ej., Gemini Code Assist y modos de agente).
Gemini 3 Pro se presenta por parte de Google como optimizado tanto para experiencias interactivas de desarrolladores (codificación de baja latencia y flujos de trabajo de agentes) como para una comprensión multimodal de alta fidelidad (interpretación y razonamiento a través de entradas de medios mixtos).
Funciones principales de Gemini 3.1 Pro
Gemini-3.1 Pro (a través de su vista previa) introduce las siguientes funciones:
Integración multimodal
Procesa entradas en:
- Lenguaje natural
- Imágenes
- Voz/audio
- Video
con una representación de tokens unificada para el razonamiento entre modalidades.
Ventana de contexto ampliada
Una capacidad de contexto excepcionalmente grande de hasta ~1 millón de tokens permite manejar:
- Documentos largos
- Síntesis de múltiples documentos
- Bases de código y transcripciones.
Esto supera a muchos modelos de la competencia que normalmente admiten ~32 K–262 K tokens.
Escalado con mezcla de expertos dispersa (MoE)
El enrutamiento MoE disperso permite escalar la capacidad interna del modelo sin costes de cómputo proporcionales, mejorando el razonamiento a escala.
Razonamiento / planificación avanzados
Innovaciones como el entrenamiento de cadena de pensamiento, el aprendizaje por refuerzo a partir de retroalimentación humana y bancos de pruebas especializados lo hacen sólido en tareas lógicas y matemáticas.
Benchmarks supuestos:
AIME 2025: 100% (con ejecución de código)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
Casos de uso representativos para empresas
- Pipelines multimedia de extremo a extremo: Ingerir video, transcripciones e imágenes para producir resúmenes sincronizados, metadatos y conocimientos estructurados a escala.
- Generación y revisión de código a gran escala: Usar en IDEs y pipelines de CI para autogenerar código, refactorizar proyectos multifichero y proponer pruebas en grandes bases de código.
- Automatización agéntica: Coordinar agentes con múltiples herramientas que interactúan con servicios en la nube, sistemas de orquestación y APIs internas mediante llamadas a funciones estructuradas.
- Investigación y producción de contenido: Redactar contenido de formato largo (informes, libros) que combine texto y multimedia incrustado, preservando las referencias cruzadas internas.
Cómo acceder a la API de Gemini 3.1 Pro
Paso 1: Regístrate para obtener una clave de API
Inicia sesión en cometapi.com. Si aún no eres nuestro usuario, regístrate primero. Accede a tu consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de API del centro personal, obtén la clave del token: sk-xxxxx y envíala.
Paso 2: Envía solicitudes a la API de Gemini 3.1 Pro
Selecciona el endpoint “gemini-3.1-pro” para enviar la solicitud a la API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio también proporciona pruebas en Apifox para tu comodidad. Sustituye <YOUR_API_KEY> por tu clave real de CometAPI de tu cuenta. La URL base es Generación de contenido de Gemini y Chat.
Inserta tu pregunta o solicitud en el campo de contenido—esto es a lo que responderá el modelo. Procesa la respuesta de la API para obtener la respuesta generada.
Paso 3: Recupera y verifica los resultados
Procesa la respuesta de la API para obtener la respuesta generada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.
Consulta también API de Gemini 3 Pro