Especificaciones técnicas de GPT-5.4-2026-03-05
| Elemento | GPT-5.4-2026-03-05 |
|---|---|
| Familia del modelo | GPT-5 |
| Proveedor | OpenAI |
| Fecha de lanzamiento | 5 de marzo de 2026 |
| Ventana de contexto | 1,050,000 tokens |
| Máximo de tokens de salida | 128,000 |
| Tipos de entrada | Texto, Imagen |
| Tipos de salida | Texto |
| Audio | No admitido |
| Controles de razonamiento | none, low, medium, high, xhigh |
| Compatibilidad con herramientas | Búsqueda web, Búsqueda de archivos, Intérprete de código, Generación de imágenes |
| Fecha límite de conocimiento | 31 de agosto de 2025 |
| Estabilidad de la instantánea | Comportamiento del modelo bloqueado |
¿Qué es GPT-5.4?
GPT-5.4 es una versión unificadora de vanguardia que fusiona mejoras recientes en razonamiento y código (incluido el trabajo GPT-5.3-Codex) en un único modelo orientado al trabajo profesional del conocimiento. Se posiciona como un modelo “Thinking” para un razonamiento más profundo y controlable y como una variante “Pro” para clientes que requieren el máximo rendimiento/throughput. Los temas clave del lanzamiento son: (1) comprensión de contexto más largo y a escala de documentos, (2) capacidades mejoradas de herramientas y “computer use” (control de aplicaciones, edición de hojas de cálculo/presentaciones) y (3) reducción de errores fácticos y planificación multietapa más sólida.
Características principales de GPT-5.4
- Capacidad de contexto largo enorme (experimental de 1M+ tokens): GPT-5.4 admite sesiones experimentales de 1.05M tokens (con precios/límites), lo que permite razonamiento a escala de libros/código completo y síntesis multidocumento. Para disponibilidad general, la ventana estándar sigue siendo ≈272K tokens.
- Uso de herramientas multietapa y “computer use” nativo mejorados: mejor control de escritorio/navegador para flujos de trabajo agentivos (teclado/ratón mediante una interfaz de “computer use”), búsqueda web que persiste entre rondas y un nuevo mecanismo de Tool Search para encontrar conectores/herramientas de forma eficiente. OpenAI reporta resultados de vanguardia en múltiples benchmarks de computer-use y agentes web.
- Generación/edición de hojas de cálculo, documentos y presentaciones: ajuste específico para flujos de trabajo de oficina; benchmarks internos muestran grandes mejoras en modelado de hojas de cálculo y calidad de presentaciones. OpenAI también lanzó un ChatGPT for Excel add-in junto con el lanzamiento.
- Capacidad de control y modos de razonamiento: el modo “Thinking” produce un plan/preámbulo explícito para tareas largas y admite control en mitad de la respuesta (ajustando instrucciones durante la generación). Los niveles de esfuerzo de razonamiento permiten a los usuarios intercambiar latencia por un razonamiento de cadena de pensamiento más profundo.
- Comprensión multimodal mejorada: mejor interpretación de imágenes y gráficos de alta resolución (entrada de imagen), utilizada para comprensión de documentos y presentaciones.
- Postura de seguridad: OpenAI trata a GPT-5.4 como un modelo de alta capacidad cibernética y despliega salvaguardas mejoradas similares a las mitigaciones de GPT-5.3-Codex.
Rendimiento en benchmarks
| GPT-5.4 | GPT-5.3-Codex | GPT-5.2 | |
|---|---|---|---|
| GDPval (victorias o empates) | 83.0% | 70.9% | 70.9% |
| SWE-Bench Pro (Public) | 57.7% | 56.8% | 55.6% |
| OSWorld-Verified | 75.0% | 74.0%* | 47.3% |
| Toolathlon | 54.6% | 51.9% | 46.3% |
| BrowseComp | 82.7% | 77.3% | 65.8% |
GPT-5.4 vs Modelos comparables
| Modelo | Ventana de contexto | Fortaleza principal |
|---|---|---|
| GPT-5.4-2026-03-05 | 1,050,000 tokens | Razonamiento de frontera + flujos de trabajo agentivos |
| GPT-5.3 Instant | Más pequeña | Tareas cotidianas más rápidas |
| Claude Opus / Sonnet | ~200k tokens | Razonamiento de formato largo |
| Gemini 3 Pro | ~1M tokens | Razonamiento multimodal |
Clave: GPT-5.4 se centra fuertemente en flujos de trabajo de productividad profesional y capacidades de agente, particularmente cuando se integra con herramientas externas.
Casos de uso representativos en producción
- Flujos de trabajo de documentos empresariales y cumplimiento: procesamiento de contratos largos, extracción de obligaciones y redacción de comentarios en corpora multidocumento (se beneficia de las opciones de contexto de 272K→1M para síntesis en una sola sesión).
- Automatización de hojas de cálculo y modelización financiera: generación de fórmulas, creación de modelos de varias hojas a partir de especificaciones en inglés sencillo, conciliación de entradas —OpenAI reporta grandes mejoras en tareas al estilo de banca de inversión junior—.
- Automatización agentiva y “computer use”: flujos de trabajo automatizados de navegador/escritorio (instalación, QA, orquestación de herramientas) y cadenas de herramientas multietapa (se citan integraciones con Zapier como socio de uso).
- Ingeniería de software y mantenimiento de código: generación de código, refactorizaciones y tareas de agente en terminal/CLI (se reportan mejoras en Terminal-Bench). Para bases de código grandes, la ventana de contexto larga ayuda, pero debe validarse según heurísticas de la tarea.
- Potenciación del trabajador del conocimiento: síntesis de investigación (mejoras en BrowseComp), generación de diapositivas y diseño visual para presentaciones.
Cómo acceder a la API de GPT-5.4
Paso 1: Regístrese para obtener una clave API
Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Inicie sesión en su consola de CometAPI. Obtenga la clave API de acceso a la interfaz. Haga clic en “Add Token” en el apartado de token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíela.

Paso 2: Envíe solicitudes a la API de GPT-5.4
Seleccione el endpoint “gpt-5.4” para enviar la solicitud de API y establecer el cuerpo de la solicitud. El método de la solicitud y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también proporciona pruebas en Apifox para su conveniencia. Reemplace <YOUR_API_KEY> por su clave real de CometAPI de su cuenta. La URL base es Chat Completions y Responses.
Inserte su pregunta o solicitud en el campo content —esto es a lo que el modelo responderá—. Procese la respuesta de la API para obtener la respuesta generada.
Paso 3: Recupere y verifique los resultados
Procese la respuesta de la API para obtener la respuesta generada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.




.webp)