Modelos de OpenAI

Comience con GPT-5.6 Sol para razonamiento y programación complejos, elija GPT-5.6 Terra para equilibrar la inteligencia y el costo, o use GPT-5.6 Luna para cargas de trabajo de alto volumen sensibles al costo.

GPT Image 2

Entrada:$4/M

Salida:$24/M

GPT Image 2 es el modelo de generación de imágenes de última generación de OpenAI para generar y editar imágenes de forma rápida y de alta calidad. Admite tamaños de imagen flexibles y entradas de imagen de alta fidelidad.

GPT 5.5 Pro

GPT-5.5 Pro combina inteligencia de última generación, precisión y eficiencia para abordar desafíos complejos. Desde el desarrollo de software y el análisis de datos hasta la investigación y el apoyo a la toma de decisiones, ofrece asistencia de nivel experto con rapidez y consistencia.

GPT 5.5

Model 5.5 es un modelo de IA de próxima generación, diseñado para ofrecer un razonamiento más sólido, respuestas más rápidas y una mayor precisión en una amplia gama de tareas. Destaca en la comprensión de instrucciones complejas, la generación de contenido de alta calidad y la asistencia en programación, análisis y resolución de problemas.

GPT-5.4 nano

GPT-5.4 Nano es un modelo de IA ultraligero diseñado para ofrecer la máxima velocidad y eficiencia. Está optimizado para tareas simples, interacciones en tiempo real y despliegues a gran escala donde la baja latencia y el consumo mínimo de recursos son esenciales.

GPT-5.4 mini

GPT-5.4 Mini es un modelo de IA ligero y eficiente, optimizado para la velocidad y la productividad del día a día. Ofrece capacidades conversacionales fiables, generación de contenido y asistencia en tareas, manteniendo una latencia baja y un uso de recursos reducido.

GPT-5.4 pro

Contexto:1,050,000

GPT-5.4 Pro es un modelo de IA de alto rendimiento diseñado para aplicaciones profesionales y empresariales. Ofrece razonamiento sólido, precisión fiable y ejecución eficiente en tareas como la creación de contenido, la programación, la investigación y el análisis de datos.

GPT Image 2 ALL

Por Solicitud:$0.04

GPT Image 2 ALL es un modelo integral de generación de imágenes diseñado para abordar una amplia gama de tareas visuales creativas y profesionales. Combina la creación de imágenes de alta calidad, una comprensión avanzada de instrucciones y un soporte versátil de estilos para ofrecer resultados excepcionales en una amplia variedad de casos de uso.

GPT 5.5 ALL

Entrada:$2.4/M

Salida:$14.4/M

GPT-5.5 destaca en escritura de código, investigación en línea, análisis de datos y operaciones entre herramientas. El modelo no solo mejora su autonomía para manejar tareas complejas de múltiples pasos, sino que también mejora significativamente las capacidades de razonamiento y la eficiencia de ejecución, manteniendo la misma latencia que su predecesor, lo que marca un paso importante hacia la automatización de oficina impulsada por IA.

Sora 2 Pro

Por Segundo:$0.24

Sora 2 Pro es nuestro modelo de generación multimedia más avanzado y potente, capaz de generar videos con audio sincronizado. Puede crear clips de video detallados y dinámicos a partir de lenguaje natural o imágenes.

Sora 2

Por Segundo:$0.08

Modelo de generación de video súper potente, con efectos de sonido, admite formato de chat.

GPT-5.4

Contexto:1,050,000

GPT-5.4 es el modelo de vanguardia para trabajos profesionales complejos. Reasoning.effort admite: none (default), low, medium, high y xhigh.

GPT-5.3 Chat

Entrada:$1.4/M

Salida:$11.2/M

Modelo GPT-5.3 Instant utilizado en ChatGPT

gpt-audio-1.5

Entrada:$2/M

El mejor modelo de voz para entrada y salida de audio con Chat Completions.

gpt-realtime-1.5

Contexto:32,000

Entrada:$3.2/M

Salida:$12.8/M

El mejor modelo de voz para audio de entrada y de salida.

GPT 5.3 Codex

Entrada:$1.4/M

Salida:$11.2/M

GPT-5.3-Codex está optimizado para tareas de codificación con agentes en Codex o entornos similares. GPT-5.3-Codex admite configuraciones de esfuerzo de razonamiento low, medium, high y xhigh.

GPT Image 1.5

Entrada:$6.4/M

Salida:$25.6/M

GPT-Image-1.5 es el modelo de imagen de OpenAI dentro de la familia GPT Image. Es un modelo GPT multimodal nativo diseñado para generar imágenes a partir de prompts de texto y realizar ediciones de alta fidelidad en imágenes de entrada, siguiendo de cerca las instrucciones del usuario.

GPT-5.2 Pro

Entrada:$16.8/M

Salida:$134.4/M

gpt-5.2-pro es el miembro de mayor capacidad, orientado a producción, de la familia GPT-5.2 de OpenAI, disponible a través de la Responses API para cargas de trabajo que exigen fidelidad máxima, razonamiento multietapa, uso extensivo de herramientas y los mayores límites de contexto y throughput que ofrece OpenAI.

GPT-5.1 Chat

Contexto:400.0k

Entrada:$1/M

GPT-5.1 Chat es un modelo de lenguaje conversacional ajustado mediante instrucciones para chat, razonamiento y redacción de propósito general. Admite diálogos de múltiples turnos, resumen, elaboración de borradores, preguntas y respuestas sobre bases de conocimiento y asistencia ligera en código para asistentes integrados en aplicaciones, automatización de soporte y copilotos de flujos de trabajo. Los aspectos técnicos destacados incluyen alineación optimizada para chat, salidas controlables y estructuradas, y vías de integración para la invocación de herramientas y flujos de recuperación cuando estén disponibles.

GPT-5.1

Entrada:$1/M

GPT-5.1 es un modelo de lenguaje de propósito general ajustado mediante instrucciones, centrado en la generación de texto y el razonamiento en flujos de trabajo de producto. Admite diálogo de múltiples turnos, formateo de salidas estructuradas y tareas orientadas al código, como redacción, refactorización y explicación. Los usos típicos incluyen asistentes de chat, preguntas y respuestas aumentadas mediante recuperación, transformación de datos y automatización al estilo agente con herramientas o APIs cuando están disponibles. Los aspectos técnicos destacados incluyen una modalidad centrada en el texto, seguimiento de instrucciones, salidas de estilo JSON y compatibilidad con llamadas a funciones en marcos de orquestación comunes.

GPT Image 1 mini

Contexto:2M

Entrada:$6.4/M

Salida:$25.6/M

Versión optimizada en costos de GPT Image 1. Es un modelo de lenguaje multimodal nativo que admite como entrada tanto texto como imágenes y genera imágenes como salida.

GPT-5

Contexto:400K

Entrada:$1/M

GPT-5 es el modelo de programación más potente de OpenAI hasta la fecha. Muestra mejoras significativas en la generación de front-end complejos y en la depuración de grandes bases de código. Puede transformar ideas en realidad con resultados intuitivos y estéticamente atractivos, creando sitios web, aplicaciones y juegos bellos y responsivos con un agudo sentido estético, todo a partir de un único prompt. Los primeros evaluadores también han señalado sus elecciones de diseño, con una comprensión más profunda de elementos como el espaciado, la tipografía y el espacio en blanco.

GPT-5 nano

Contexto:400K

Entrada:$0.04/M

Salida:$0.32/M

GPT-5 Nano es un modelo de inteligencia artificial proporcionado por OpenAI.

GPT-5 mini

Contexto:400K

Entrada:$0.2/M

Salida:$1.6/M

GPT-5 mini es el miembro de la familia GPT-5 de OpenAI optimizado en costos y latencia, diseñado para ofrecer gran parte de las capacidades multimodales y de seguimiento de instrucciones de GPT-5 a un costo sustancialmente menor para su uso en producción a gran escala. Está orientado a entornos donde el rendimiento, los precios por token predecibles y las respuestas rápidas son las principales restricciones, a la vez que sigue proporcionando sólidas capacidades de propósito general.

GPT 5.3

Próximamente

Salida:$480/M

Próximamente

GPT 4o Image

Por Solicitud:$0.04

gpt-4o-image genera imágenes como salida, opcionalmente usando imágenes como entrada

GPT-5.2

Entrada:$1.4/M

Salida:$11.2/M

GPT-5.2 es una suite de modelos con múltiples variantes (Instant, Thinking, Pro) diseñada para mejorar la comprensión de contextos largos, fortalecer las capacidades de programación y el uso de herramientas, y ofrecer un rendimiento sustancialmente superior en pruebas de referencia profesionales de “trabajo del conocimiento”.

O3 Pro

Contexto:200K

Entrada:$16/M

Salida:$64/M

OpenAI o3‑pro es una variante “pro” del modelo de razonamiento o3, diseñada para pensar durante más tiempo, ofrecer las respuestas más fiables mediante el uso de aprendizaje por refuerzo con cadena de pensamiento privada y establecer nuevos estándares de última generación en ámbitos como la ciencia, la programación y los negocios—mientras integra de forma autónoma herramientas como la búsqueda en la web, el análisis de archivos, la ejecución de Python y el razonamiento visual dentro de la API.

TTS

Salida:$12/M

Texto a voz de OpenAI

Whisper-1

Entrada:$24/M

Salida:$24/M

Transcripción de voz a texto, creación de traducciones

tts-1

Salida:$12/M

GPT-4o mini TTS

Entrada:$9.6/M

Salida:$9.6/M

GPT-4o mini TTS es un modelo neuronal de texto a voz diseñado para la generación de voz natural y de baja latencia en aplicaciones orientadas al usuario. Convierte texto en voz con sonido natural, con voces seleccionables, salida en múltiples formatos y síntesis en streaming para experiencias con gran capacidad de respuesta. Los usos típicos incluyen asistentes de voz, IVR y flujos de contacto, lectura en voz alta de productos y narración de medios. Los aspectos técnicos destacados incluyen transmisión basada en API y exportación a formatos de audio comunes como MP3 y WAV.

o1-pro-2025-03-19

Entrada:$120/M

Salida:$480/M

GPT-4o Transcribe

Entrada:$2/M

GPT-4o Transcribe es un modelo de audio a texto para reconocimiento de voz multilingüe y de baja latencia. Admite transmisión en tiempo real y transcripción por lotes a partir de formatos de audio comunes, con puntuación y segmentación de oraciones. Los usos típicos incluyen subtítulos en tiempo real, entrada para asistentes de voz, notas de reuniones y transcripción de medios o grabaciones de llamadas. Entre los aspectos técnicos destacados se incluyen compatibilidad con la modalidad de audio, procesamiento de contenidos de larga duración y APIs adecuadas para flujos de trabajo interactivos y del lado del servidor.

GPT-4o mini Search Preview

Salida:$240/M

GPT-4o mini Search Preview es un modelo multimodal compacto de la familia GPT-4o orientado a interacciones centradas en la búsqueda y flujos de trabajo de recuperación. Interpreta y reformula consultas, sintetiza respuestas concisas y puede fundamentar las respuestas mediante búsqueda externa cuando se integra mediante llamadas a herramientas/funciones. Los usos típicos incluyen asistentes de búsqueda integrados en el producto, QA sobre bases de conocimiento, descubrimiento en comercio electrónico y comprensión de consultas para clasificación y enrutamiento. Los aspectos técnicos destacados incluyen entradas de texto e imagen, seguimiento de instrucciones, formatos de salida estructurados e integración del uso de herramientas para pipelines RAG.

GPT-4o mini Audio Preview

Salida:$240/M

GPT-4o mini Audio Preview es un modelo multimodal compacto para crear aplicaciones de audio conversacionales. Admite entrada y salida de voz junto con texto, lo que permite el reconocimiento de voz, la síntesis de voz y diálogos mixtos texto-audio con invocación de herramientas y funciones para acciones estructuradas. Los usos típicos incluyen asistentes de voz, transcripción en streaming con resumen, flujos de trabajo de IVR y de bots de llamadas, y asistentes integrados en la aplicación con funciones de audio. Los aspectos técnicos destacados incluyen E/S de audio, respuestas en streaming, seguimiento de instrucciones e integración mediante las APIs de chat y de herramientas.

GPT-4o mini Realtime Preview

Salida:$240/M

GPT-4o mini Realtime Preview es un modelo multimodal en tiempo real para experiencias interactivas de voz y visuales. Procesa voz, texto e imágenes con entrada y salida en streaming, además de llamadas a herramientas/funciones para acciones fundamentadas. Los casos de uso típicos incluyen asistentes de voz, gestión de llamadas en vivo, subtitulado en tiempo real y respuesta a preguntas visuales sobre contenido de cámara o de pantalla. Entre los aspectos técnicos destacados se incluyen audio bidireccional, comprensión visual, respuestas en streaming y salidas estructuradas mediante funciones.

o1-2024-12-17

Salida:$48/M

GPT-4o mini Audio

Entrada:$0.12/M

Salida:$0.48/M

GPT-4o mini Audio es un modelo multimodal para interacciones de voz y texto. Realiza reconocimiento de voz, traducción y conversión de texto a voz, sigue instrucciones y puede invocar herramientas para acciones estructuradas con respuestas en streaming. Los usos típicos incluyen asistentes de voz en tiempo real, subtitulación y traducción en vivo, resumen de llamadas y aplicaciones controladas por voz. Los aspectos técnicos destacados incluyen entrada y salida de audio, respuestas en streaming, llamadas a funciones y salida JSON estructurada.

An Ada-based text embedding model optimized for various NLP tasks.

text-embedding-3-small

Entrada:$0.016/M

Salida:$0.016/M

A small text embedding model for efficient processing.

text-embedding-3-large

Entrada:$0.104/M

Salida:$0.104/M

A large text embedding model for a wide range of natural language processing tasks.

GPT Image 1

Entrada:$8/M

Salida:$32/M

Un modelo de IA avanzado para generar imágenes a partir de descripciones de texto.

dall-e-3

Por Solicitud:$0.016

New version of DALL-E for image generation.

o4-mini

Entrada:$0.88/M

Salida:$3.52/M

O4-mini es un modelo de inteligencia artificial proporcionado por OpenAI.

o3-mini

Entrada:$0.88/M

Salida:$3.52/M

O3-mini es un modelo de inteligencia artificial proporcionado por OpenAI.

o3

Entrada:$1.6/M

Salida:$6.4/M

O3 es un modelo de inteligencia artificial proporcionado por OpenAI.

o1-pro

Entrada:$120/M

Salida:$480/M

O1-pro is an artificial intelligence model provided by OpenAI.

o1

Salida:$48/M

O1 is an artificial intelligence model provided by OpenAI.

gpt-oss-20b

Entrada:$0.08/M

Salida:$0.32/M

gpt-oss-20b es un modelo de inteligencia artificial proporcionado por cloudflare-workers-ai.

gpt-oss-120b

Entrada:$0.16/M

Salida:$0.8/M

gpt-oss-120b es un modelo de inteligencia artificial proporcionado por cloudflare-workers-ai.

GPT-4o mini

Entrada:$0.12/M

Salida:$0.48/M

GPT-4o mini es un modelo de inteligencia artificial proporcionado por OpenAI.

GPT-4o

Entrada:$2/M

GPT-4o es el modelo multimodal más avanzado de OpenAI, más rápido y más económico que GPT-4 Turbo, con capacidades visuales más potentes. Este modelo tiene un contexto de 128K y un límite de conocimiento de octubre de 2023. Los modelos de la serie 1106 y superiores admiten tool_calls y function_call. Este modelo admite una longitud máxima de contexto de 128,000 tokens.

GPT-4.1 nano

Contexto:1.0M

Entrada:$0.08/M

Salida:$0.32/M

GPT-4.1 nano es un modelo de inteligencia artificial proporcionado por OpenAI. gpt-4.1-nano: Ofrece una ventana de contexto más amplia—admite hasta 1 millón de tokens de contexto y es capaz de aprovechar mejor ese contexto gracias a una comprensión de largo contexto mejorada. Tiene una fecha de corte de conocimiento actualizada a junio de 2024. Este modelo admite una longitud máxima de contexto de 1,047,576 tokens.

GPT 4.1 mini

Contexto:1.0M

Entrada:$0.32/M

Salida:$1.28/M

GPT-4.1 mini es un modelo de inteligencia artificial proporcionado por OpenAI. gpt-4.1-mini: un salto significativo en el rendimiento de modelos pequeños, incluso superando a GPT-4o en muchas pruebas de referencia. Está a la par de GPT-4o o lo supera en evaluación de inteligencia, mientras reduce la latencia casi a la mitad y el costo en un 83%. Este modelo admite una longitud máxima de contexto de 1,047,576 tokens.

GPT-4.1

Contexto:1.0M

Entrada:$1.6/M

Salida:$6.4/M

GPT-4.1 es un modelo de inteligencia artificial proporcionado por OpenAI. gpt-4.1-nano: Presenta una ventana de contexto más amplia—admite hasta 1 millón de tokens de contexto y es capaz de aprovechar mejor ese contexto gracias a una comprensión mejorada de contextos largos. Tiene una fecha de corte de conocimiento actualizada a junio de 2024. Este modelo admite una longitud máxima de contexto de 1,047,576 tokens.

GPT 6

Próximamente