Sora 2 es el primer modelo de texto a video de disponibilidad general de OpenAI, accesible de forma programática tanto a través de la API oficial de OpenAI como de un conjunto creciente de rutas de agregadores. El modelo de precios es inusual en comparación con los modelos de texto (la facturación es por segundo de video generado en lugar de por token), y las preguntas prácticas que los desarrolladores se hacen antes de integrar son diferentes a las de una API de LLM. ¿Cuánto cuesta realmente un clip? ¿Cuánto tarda la generación? ¿Cuáles son los límites de tasa? ¿Qué cambia cuando accedes a Sora a través de un agregador en lugar de directamente con OpenAI?
Este artículo es la referencia que desearíamos haber tenido cuando empezamos a definir nuestras propias funciones de generación de video. La pieza está estructurada para el desarrollador que ya superó el “¿Sora es interesante?” y ahora necesita responder “¿cuánto costará, qué tomará integrarlo y qué debo saber antes de comprometerme?”
Lectura rápida: Sora 2 (el modelo estándar) cuesta $0.10 por segundo de video generado a 720p. Sora 2 Pro cuesta $0.30 por segundo a 720p o $0.50 por segundo a 1024p. Un clip típico de 10 segundos cuesta $1.00 en el modelo estándar y $5.00 en Pro a HD. El tiempo de generación es asíncrono; espera entre 30 y 90 segundos de tiempo real para un clip de 5–10 segundos. El acceso requiere una cuenta de OpenAI de pago en nivel de uso mínimo 2.
El estado del acceso a la API de Sora en 2026
Sora 2 se lanzó en la API de OpenAI el 7 de octubre de 2025 y el acceso ha estado disponible de forma continua desde entonces. El identificador del modelo es sora-2 (con un ID de snapshot actual de sora-2-2025-12-08), y la variante de mayor fidelidad es sora-2-pro. Ambos admiten generación de texto a video e imagen a video, con salida de audio sincronizada. A partir del 10 de enero de 2026, se descontinuó el acceso de consumidores del nivel gratuito a través del producto ChatGPT, lo que ha concentrado el uso de Sora de nivel desarrollador en suscripciones de pago de ChatGPT o acceso directo a la API.
Hay tres vías para usar Sora de forma programática:
- API directa de OpenAI. La ruta canónica. Facturación por segundo, solo de pago, requiere una recarga mínima de $10 para alcanzar el nivel de uso 2 que desbloquea el acceso a Sora. Admite tanto SDK como API REST.
- Azure OpenAI. La ruta empresarial de Microsoft, que refleja las tarifas oficiales de OpenAI con la adición de la sobrecarga de suscripción de Azure y funciones de cumplimiento para empresas. Mismo precio por segundo; superficie operativa diferente.
- Agregadores. Servicios que exponen Sora detrás de su propia API unificada. La mayoría de los agregadores trasladan la tarifa por segundo de OpenAI en paridad; el valor es operativo (una credencial, una factura, el mismo SDK que tu tráfico de modelos de texto). Algunos agregadores ofrecen sus propias estructuras tarifarias, que analizamos más adelante en el artículo.
Sora 2: precios por segundo de video
La tarificación de Sora se estructura por nivel de modelo y resolución de salida, con una tarifa por segundo que se multiplica por la duración del clip para dar el costo de generación. Verificado en la página oficial de precios de OpenAI a mayo de 2026:
| Modelo | Resolución | Duraciones admitidas | Precio por segundo | Clip de 10 segundos |
|---|---|---|---|---|
| Sora 2 (estándar) | 720p | 4s, 8s, 12s | $0.10 | $1.00 |
| Sora 2 Pro | 720p | 10s, 15s, 25s | $0.30 | $3.00 |
| Sora 2 Pro | 1024p (1792×1024) | 10s, 15s, 25s | $0.50 | $5.00 |
Notas sobre la estructura de precios. La tarificación es por salida, no por entrada; no hay facturación por tokens de entrada para Sora como la hay para los modelos de texto. El acondicionamiento por imagen (pasar una imagen de referencia para anclar la generación) no cambia la tarifa por segundo. Las opciones de duración para cada nivel de modelo son fijas: no puedes solicitar un clip de 7 segundos en el modelo estándar, solo 4, 8 o 12 segundos.
Dos implicaciones prácticas que vale la pena explicitar. Primero: el modelo de precios se parece más a una factura de renderizado de video que a una factura de LLM. El costo está impulsado por la duración de la salida, no por cuán complejo sea tu prompt o cuántos tokens contenga. Segundo: la diferencia de costo entre Sora 2 y Sora 2 Pro en HD es de 5x por segundo: un clip de 10 segundos cuesta $1.00 en estándar y $5.00 en Pro a 1024p. Elegir el nivel adecuado para la tarea es la palanca de costo más importante que tienes, y vale la pena ser intencional sobre qué cargas realmente necesitan la mayor fidelidad de Pro.
Límites de tasa y cuotas
Los límites de tasa de Sora se organizan en torno al sistema estándar de niveles de uso de OpenAI. Los detalles relevantes específicos de Sora:
- Requisito mínimo de nivel: Nivel 2, alcanzado recargando al menos $10 de crédito de API. El nivel 1 (predeterminado para cuentas nuevas) no incluye acceso al modelo Sora.
- Límites de generación concurrente: Según la documentación de límites de tasa de OpenAI, la generación de video concurrente está restringida por nivel, típicamente un pequeño número de generaciones en curso en niveles bajos, escalando con el nivel de uso. El techo exacto se establece por cuenta y es visible en el panel de OpenAI. Para cargas de alto volumen, planifica el acceso de nivel 3 o 4 desde el primer día.
- Solicitudes de cuota: Se pueden solicitar límites de concurrencia más altos más allá de los techos predeterminados del nivel a través del formulario de aumento de límite de tasa de OpenAI. La aprobación depende de la carga de trabajo y no es inmediata; para lanzamientos a producción con picos de demanda previsibles, solicita el aumento varias semanas antes del lanzamiento.
Importante saber: los límites de tasa de Sora se agrupan de forma diferente a los límites de los modelos de texto en la misma cuenta. Un equipo que ejecute mucho tráfico de Sora no afecta su presupuesto de tasa disponible para llamadas a GPT-5.5. Y a la inversa, un gran tráfico de GPT-5.5 no consume el presupuesto de Sora. Planifica ambos como cuestiones de capacidad separadas.
Tiempo de generación: qué esperar en la práctica
Sora es asíncrono por diseño. Envías una solicitud de generación, recibes un ID de trabajo y haces polling (o recibes un webhook) hasta la finalización. El tiempo real entre la solicitud y la finalización depende de la duración y la resolución de la salida, la carga actual en la infraestructura de OpenAI y si el trabajo está en cola detrás de otros en tu cuenta.
Expectativas realistas basadas en el comportamiento observado:
| Salida | Tiempo real típico | Notas |
|---|---|---|
| Sora 2 estándar, 4s @ 720p | 20–45 segundos | Camino más rápido; bueno para iteración |
| Sora 2 estándar, 8s @ 720p | 40–90 segundos | Duración de producción más común |
| Sora 2 estándar, 12s @ 720p | 60–120 segundos | Contenido social de mayor duración |
| Sora 2 Pro, 10s @ 720p | 60–150 segundos | Calidad premium; costo ~3x del estándar |
| Sora 2 Pro, 15s @ 1024p | 120–240 segundos | Full HD, mayor cola observada en horas pico |
| Sora 2 Pro, 25s @ 1024p | 200–360 segundos | Duración máxima; el precio escala linealmente |
Dos consecuencias operativas:
- Los presupuestos de latencia de cara al usuario requieren replanteamiento. Si tu producto espera que la generación de video se sienta sensible a una acción del usuario, el rango de 30–90 segundos para clips cortos significa que necesitas una UX que gestione la espera: indicadores de progreso, trabajo en paralelo que el usuario pueda hacer mientras se genera el video, o pre-generación para escenarios previsibles. Tratar Sora como una llamada de API síncrona es el error arquitectónico más común que cometen los equipos.
- Importa sondeo versus webhooks. Un sondeo ingenuo (un bucle apretado golpeando el endpoint de estado) desperdicia tanto tu presupuesto de límite de tasa como el cómputo del modelo. Usa retroceso exponencial con jitter, o configura callbacks de webhook si tu entorno los admite. El patrón de sondeo que funciona bien en producción es sondear cada 10 segundos durante el primer minuto, luego intervalos de 30 segundos después de eso, con un timeout rígido en el límite superior esperado del modelo para la duración solicitada.
Parámetros admitidos y estructura del prompt
La superficie de la API de Sora es intencionalmente simple en comparación con modelos de generación de imagen como DALL-E 3. Hay menos perillas que girar, pero las que existen importan. Los parámetros relevantes:
- model: sora-2 o sora-2-pro. La elección determina tanto el precio como las opciones disponibles de duración/resolución según la tabla de precios anterior.
- prompt: Texto libre que describe la escena. Sora maneja dirección cinematográfica (ángulos de cámara, movimiento, iluminación), acciones de los personajes y detalles del entorno. El modelo es sensible a la estructura del prompt: empezar estableciendo la escena, luego la acción y después la dirección técnica, produce resultados más fiables que un solo párrafo denso.
- image: Imagen de referencia opcional para generación de imagen a video. La referencia actúa como ancla del primer fotograma; el modelo genera el movimiento a partir de ese punto de partida. Útil para demos de producto, continuidad de personajes y cualquier escenario donde la apariencia estática del sujeto sea innegociable.
- duration: Duración en segundos. Restringida a las opciones discretas del modelo elegido (4/8/12 para sora-2, 10/15/25 para sora-2-pro). El costo escala linealmente con la duración.
- size: Resolución. 720x1280 (vertical) o 1280x720 (horizontal) en el modelo estándar; agrega 1024x1792 / 1792x1024 en Pro. La relación de aspecto es implícita en la selección de tamaño.
Ausencias destacables. Sora no expone actualmente control de seed a través de la API pública (por lo que no se garantiza la reproducibilidad entre ejecuciones), ni expone controles de estilo individuales como lo hace Midjourney u otros modelos de imagen. El modelo es opinado; la ingeniería de prompts es la palanca principal, no el ajuste de parámetros.
Un ejemplo sencillo de una solicitud de generación con Sora 2, usando el SDK de Python de OpenAI:
| from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Crear el trabajo de generación de videojob = client.videos.create(model="sora-2",prompt=("Una toma gran angular de una montaña nevada al amanecer. ""La cámara se desplaza lentamente hacia la izquierda cuando la primera luz golpea la cumbre. ""Cinemático, hora dorada, iluminación de calidad 4K."),size="1280x720",duration=8,)# Sondear hasta la finalizaciónwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Fallo en la generación: {job.error}")print(f"Estado actual: {job.status}")time.sleep(10)print(f"Video listo: {video_url}") |
|---|
Ejemplos de costo trabajados
La tarificación por segundo hace que el costo sea predecible, pero solo una vez que tienes claro el perfil de tu carga. Tres escenarios representativos:
Escenario 1: Una demo corta de producto para una landing de SaaS
Un clip de 5 segundos mostrando la UI del producto en acción, generado una vez y usado como video principal en el sitio de marketing. Esperas iterar 5–10 veces para obtener un clip con el que estés satisfecho antes de publicar.
Costo en Sora 2 estándar a 720p: 5s × $0.10 = $0.50 por generación. Con 8 iteraciones para llegar al corte final: $4.00. Costo en Sora 2 Pro a 1024p para la versión final publicada: 5s × $0.50 = $2.50 (una sola toma). Costo total del proyecto: aproximadamente $6.50 por las ejecuciones de iteración más la final en HD.
Escenario 2: Un lote de 50 clips para una campaña de marketing
50 clips de producto únicos de 8 segundos, cada uno basado en una descripción de función diferente, todos en Sora 2 estándar a 720p. Sin presupuesto de iteración; aceptas la primera generación.
Costo: 50 × 8s × $0.10 = $40.00. Agrega un 30% de presupuesto de iteración para los clips que no salgan a la primera (50 × 0.30 = 15 reintentos × 8s × $0.10 = $12). Total: aproximadamente $52.00 para la campaña.
Escenario 3: Una función de video generado por usuarios en un producto de consumo
Los usuarios en tu app generan clips de 6 segundos bajo demanda, en Sora 2 estándar a 720p. Uso promedio: 1,000 clips por día. Cobras a los usuarios $0.50 por generación y aceptas la diferencia de costo como margen unitario.
Costo por clip de usuario: 6s × $0.10 = $0.60. Con un precio al usuario de $0.50, la carga es deficitaria en el nivel estándar: cada generación cuesta $0.10 más de lo que paga el usuario. El nivel estándar 720p requiere un precio al usuario de al menos $0.65 para alcanzar el punto de equilibrio antes de la sobrecarga de infraestructura. A 30,000 clips por mes: factura mensual de Sora de $18,000. Este es el tipo de verificación de economía unitaria que vale la pena hacer antes de lanzar cualquier función de video de cara al usuario.
La conclusión común en los tres escenarios: la generación de video es realmente asequible para cargas de trabajo de marketing y contenido puntual, donde el conteo de iteraciones es acotado y lo que importa es el costo por activo final. Es significativamente más difícil para funciones de cara al usuario a escala, donde el costo por generación debe superar el precio pagado por el usuario más las sobrecargas del producto. Sé explícito sobre qué carga estás presupuestando antes de comprometerte.
Acceso directo a OpenAI frente a acceso vía agregador
Con Sora disponible a través de múltiples rutas, la pregunta práctica para la mayoría de los equipos es contra cuál integrarse. La respuesta honesta depende del resto de tu stack.
Lo que es igual
La calidad de salida, el tiempo de generación a nivel de modelo, los parámetros admitidos y el precio por segundo suelen ser idénticos independientemente de la ruta, ya que la mayoría de los agregadores trasladan la tarificación de OpenAI en paridad y el modelo en sí es el mismo. Si eliges una ruta puramente por calidad de salida, la elección es equivalente.
Lo que cambia
- Superficie de facturación. El acceso directo a OpenAI factura a través de tu cuenta de OpenAI; los agregadores facturan a través de su propio sistema de crédito o suscripción. Para equipos que ya gestionan la facturación de OpenAI para uso de modelos de texto, la ruta directa no añade nada nuevo. Para equipos con cargas multiproveedor (LLMs de Anthropic, modelos de imagen de Black Forest Labs, video de Sora), un agregador consolida todo en una sola factura.
- Observabilidad. El panel de OpenAI muestra claramente el uso de Sora a nivel de solicitud. Los paneles de los agregadores varían en cuánto manejan bien cargas de generación de video específicamente; algunos tienen observabilidad de video construida a propósito; otros tratan el video como una llamada de API genérica. Vale la pena verificar antes de comprometerse si la observabilidad es prioridad.
- Agrupación de límites de tasa. En OpenAI directo, tus límites de Sora están ligados a tu cuenta y nivel. En un agregador, los límites se agrupan entre la base de clientes del agregador en algunos casos, o se asignan por cliente en otros. Para cargas de producción de alto volumen, pregunta al agregador cómo manejan la asignación de límites de tasa antes de integrar.
- Postura geográfica y de cumplimiento. Con OpenAI directo, el procesamiento se realiza a través de la infraestructura de OpenAI con las opciones de residencia de datos que OpenAI proporciona. Algunos agregadores están ubicados en jurisdicciones donde las reglas de residencia de datos difieren; otros enrutan las solicitudes a través de la infraestructura de OpenAI en EE. UU. en cualquier caso. Para cargas reguladas, esto es decisivo, y es el tipo de cosa que vale la pena pedir al equipo de ventas del agregador por escrito.
Cómo encaja CometAPI
CometAPI expone Sora 2 y Sora 2 Pro junto con más de 500 modelos detrás de un único endpoint compatible con OpenAI, con una credencial y facturación unificada. La tarificación de Sora a través de CometAPI sigue las tarifas por segundo de OpenAI; el valor operativo es consolidar el uso de Sora con el resto de tu tráfico de modelos en una sola factura. Para equipos que ejecutan una carga mixta (modelos de texto de múltiples proveedores, generación de imágenes y video de Sora), este es el argumento central. Para equipos que usan solo Sora y solo uno o dos modelos de texto, el ahorro operativo es menor y el acceso directo a OpenAI es una elección defendible.
Consideraciones de producción
Algunos patrones que vale la pena tener correctos antes de que Sora toque tráfico de producción:
- Gestión del ciclo de vida de trabajos asíncronos. Trata cada generación de Sora como un trabajo de larga duración, no como una solicitud. Persiste el ID del trabajo inmediatamente al crearlo; sobrevive a un reinicio del servidor pudiendo reanudar el sondeo de trabajos en curso; maneja el caso en que el trabajo complete mientras tu worker está offline. Esto es higiene estándar de sistemas distribuidos, pero a menudo se omite al principio porque Sora es la primera API asíncrona que el equipo integra.
- Webhook de respaldo. Si la plataforma admite webhooks para eventos de finalización (la API de OpenAI lo hace), úsalos. Los webhooks eliminan la necesidad de sondeo y reducen tanto la presión de límite de tasa como el cómputo desperdiciado de comprobaciones frecuentes de estado. El sondeo es el recurso alternativo para entornos que no pueden exponer un endpoint de webhook.
- Modos de fallo que cuestan dinero. OpenAI no factura por generaciones fallidas, pero las finalizaciones parciales y las solicitudes reintentadas que tienen éxito en el segundo intento sí incurren en costos. En producción, registra el costo de cada reintento y alerta si tu tasa de reintentos excede lo esperado, ya que normalmente es una señal de un problema de política de contenido con los prompts que envías, que es más barato arreglar en la capa de prompts que absorber en la factura.
- Política de contenido y despliegue en producción. Sora está limitado por las políticas de uso de OpenAI, que restringen ciertas categorías de contenido. Para despliegues en producción (especialmente de cara al usuario donde el prompt está parcialmente bajo su control), revisa la documentación oficial de política de contenido de OpenAI y diseña barreras preventivas en consecuencia. Enlazar a la política de OpenAI es la referencia correcta; esa documentación es la fuente de verdad y cambia con más frecuencia que este artículo.
Qué construir primero
La lectura honesta sobre qué cargas de Sora están listas para producción hoy, cuáles están en el límite y cuáles son prematuras:
Listo para producción hoy
Cargas de marketing y contenido creativo donde la iteración está acotada y el costo por activo final es la métrica correcta. Videos de demostración de producto, contenido para campañas en redes sociales, videos hero para landing pages, material de formación interna. La economía funciona, los modos de fallo están bien entendidos y la historia de latencia (30–90 segundos para clips cortos) es aceptable cuando la persona en el bucle es el equipo de contenido y no el usuario final.
En el límite
Funciones de generación de video de cara al usuario donde el costo por clip debe superar el precio pagado por el usuario. Es viable, pero requiere economía unitaria cuidadosa: limitar la duración que los usuarios pueden solicitar, usar Sora 2 estándar a 720p por defecto, cobrar un precio que tenga margen sobre el costo por clip. La ola de apps de generación de video de consumo de inicios de 2026 está mayormente en esta categoría, y las que tienen economía sostenible han sido deliberadas al restringir lo que los usuarios pueden generar.
Prematuro
Video de formato largo a escala (cualquier cosa por encima de 25 segundos, ya que ese es el límite actual de duración de Sora), escenarios de alto volumen en tiempo real donde la latencia de reloj importa más que los dólares, y aplicaciones que esperan control a nivel de fotograma o reproducibilidad basada en semillas. Estas son cargas para reexaminar cuando la superficie de capacidad de Sora se expanda, no para forzar hoy.
El planteamiento: Sora 2 está realmente listo para producción para cargas de contenido con una persona en el bucle. Es viable para funciones de cara al usuario con economía unitaria deliberada. Es prematuro para video de formato largo y para casos que requieren parámetros que Sora aún no expone. Construye para lo que está listo hoy; sigue de cerca lo que aún no lo está.
Probarlo en tu carga de trabajo: Todas las variantes de Sora 2 y Sora 2 Pro están disponibles en CometAPI junto con los modelos de texto que quizá ya estés usando. El crédito de prueba gratuito te permite generar algunos clips con la tarifa estándar sin más configuración que apuntar tu cliente compatible con OpenAI existente al endpoint de CometAPI.
