Acesso à API do Sora em 2026: preços, limites de taxa e o que realmente está disponível por meio de agregadores
Observação importante: até minha data de conhecimento (out/2024), a OpenAI não havia publicado documentação oficial com acesso programático público para um produto denominado “Sora 2”. Não posso verificar atualizações em tempo real. Abaixo segue um guia prático para você montar uma referência completa, com os pontos que devem ser confirmados nas fontes oficiais e onde encontrá-las.
Fontes oficiais (para citar e manter atualizado)
- Documentação da API: https://platform.openai.com/docs
- Modelos: https://platform.openai.com/docs/models
- Preços: https://openai.com/pricing
- Limites de taxa: https://platform.openai.com/docs/guides/rate-limits
- Changelog: https://platform.openai.com/docs/changelog
- Status da plataforma: https://status.openai.com
- Políticas de uso: https://openai.com/policies
Como é o padrão de acesso programático a geração de mídia na OpenAI
- Endpoints: a OpenAI tipicamente expõe geração multimodal via Responses API (e, historicamente, imagens via Images API). Confirme se vídeo está disponível e em qual endpoint.
- Modelo: confirme o nome exato do modelo (ex.: “sora-2” se for o caso) na página de modelos.
- Autenticação: chave de API via Authorization: Bearer; defina região/organização se aplicável.
- Entrada: prompt de texto; verifique suporte a prompt multimodal (imagem/áudio) e condicionais.
- Saída: verifique formatos de arquivo (por exemplo, mp4/webm), URLs temporárias vs. bytes binários, callbacks/webhooks e política de expiração de links.
- Operação: saiba se a geração é síncrona (polling) ou assíncrona (job + webhook), e os estados de job.
Parâmetros comumente suportados em geração de vídeo (verificar e citar na doc)
- Duração alvo (segundos)
- Resolução (p.ex., 720p/1080p/4K) e proporção (16:9, 9:16, 1:1)
- Taxa de quadros (fps)
- Semente (seed) para reprodutibilidade
- Orientações de estilo/presets, guidance scale/creativity
- Negative prompt/evitar elementos
- Segurança/moderação (ativada/nível)
- Controle de câmera/movimento (quando disponível)
- Upscale/denoise/refine passes
- Entrada de referência (imagens/clipes) e influência
- Marcação d’água (on/off) e metadados de procedência
- Limites de token/compute para prompts longos
Precificação por segundo de vídeo (como estruturar sua referência)
- Confirme a unidade de cobrança: por segundo gerado, por resolução, por “compute minute” ou por job.
- Estruture a fórmula: custo_total ≈ (preço_por_segundo × duração) + adicionais (upscaling, estilos premium, reprocessamento).
- Verifique escalonamento por resolução (ex.: 1080p vs 4K) e por fps.
- Cite exatamente a tabela da página de preços e a data de acesso.
- Indique arredondamentos mínimos (p.ex., cobrança mínima de N segundos/job) se houver.
Limites de taxa e cotas
- Tipos comuns: requisições por minuto (RPM), tokens por minuto (TPM), segundos de vídeo por minuto/hora, jobs concorrentes, tamanho máximo do payload de upload.
- Onde ver: página de Rate Limits e seu dashboard (mostram limites por conta/modelo).
- Estratégia: inclua diretrizes sobre backoff exponencial, filas, retry idempotente, e “429/RateLimitExceeded”.
Expectativa de tempo de geração
- Fatores: duração, resolução, fps, carga global da fila, passes de upscaling/denoise e cold start.
- Expectativa: de dezenas de segundos a vários minutos para clipes curtos; confirmar números oficiais e citar. Documente SLAs se existirem.
- Operação: recomende processamento assíncrono com polling ou webhooks; defina timeouts e política de cancelamento.
Decisão prática: acesso direto à OpenAI vs agregadores
- OpenAI direto
- Vantagens: acesso a recursos mais recentes, controle fino de parâmetros, conformidade e políticas diretamente na origem, menor risco de defasagem de features.
- Desvantagens: você gerencia filas/retries; integração específica de um provedor; necessidade de lidar com mudanças de API.
- Agregadores (multi-provedor)
- Vantagens: abstração unificada, failover entre provedores, orquestração/filas/retries prontos, possivelmente otimização de custo/latência cruzando regiões/modelos.
- Desvantagens: ágio no preço, possível atraso na adoção de novos recursos, lock-in de abstração, camadas extras de compliance.
- Critérios de escolha: requisitos de compliance e dados, custo total (incluindo ágio), latência/SLAs, velocidade de acesso a features novas, necessidade de multicloud/regiões, suporte/atendimento, contratos empresariais.
Checklist de due diligence (para sua ficha “com fontes”)
- Modelo e endpoint oficiais, com links
- Parâmetros suportados e defaults, com links
- Preços por segundo e por resolução/fps; mínimos de cobrança; exemplos de custo; link da página Pricing
- Limites de taxa/cotas por conta e por modelo; políticas de retry; link da página Rate Limits
- Fluxo operacional: síncrono/assíncrono, webhooks, timeouts, status de job, idempotência
- Retenção de dados, privacidade, regiões e armazenamento; políticas de conteúdo e uso permitido
- Marcação d’água/proveniência e licenciamento do conteúdo gerado
- Requisitos de segurança (PII, criptografia, logs)
- Status/uptime e playbooks de incidentes; link do Status Page
- Versões/Changelog e política de depreciação
Modelo de ficha técnica (preencha com valores e fontes)
- Modelo: [nome exato], link: [URL da doc de modelos]
- Endpoint: [ex.: /v1/responses], método: [POST], link: [URL da doc de endpoint]
- Parâmetros obrigatórios: [lista], link: [URL da referência de parâmetros]
- Parâmetros opcionais: [lista], link: [URL]
- Saída: [formato(s) de arquivo, URLs temporárias, TTL], link: [URL]
- Preços: [valor por segundo e regras por resolução/fps], link: https://openai.com/pricing, acessado em: [data]
- Limites: [RPM/TPM/segundos por minuto/jobs concorrentes], link: https://platform.openai.com/docs/guides/rate-limits
- Geração: [síncrona/assíncrona, polling/webhook, tempos típicos], link: [URL ou changelog]
- Políticas: [uso, segurança, retenção], links: [URLs]
- Observações: [watermark, direitos de uso, depreciações futuras], link: [changelog]
Próximos passos
- Indique o(s) link(s) oficial(is) da OpenAI que você tem para “Sora 2” e a data de acesso; posso consolidar tudo nos moldes acima com citações.
- Se preferir, diga seu caso de uso (duração/resolução alvo, volume diário, SLA) para eu sugerir uma arquitetura com fila, retries e orquestração compatível com limites e custos.