Sora 2는 OpenAI가 일반 공개로 제공하는 첫 텍스트-투-비디오 모델로, 공식 OpenAI API와 점점 늘어나는 애그리게이터 라우트를 통해 프로그래밍적으로 접근할 수 있습니다. 과금 모델은 텍스트 모델과 달리 생성된 비디오의 “초” 단위로 과금되며, 통합 전 개발자가 묻는 실무적인 질문도 LLM API와는 다릅니다. 클립 한 편의 실제 비용은? 생성에는 얼마나 걸리는가? 레이트 리밋은? OpenAI를 직접 쓰지 않고 애그리게이터를 거치면 무엇이 달라지는가?
이 글은 우리가 자체 비디오 생성 기능 범위를 잡기 시작할 때 존재했으면 했던 참고서입니다. “Sora가 흥미로운가?” 단계를 지나 “비용은 얼마이고, 통합에는 무엇이 필요하며, 커밋하기 전에 무엇을 알아야 하나?”에 답해야 하는 개발자를 위해 구조화했습니다.
Quick read: Sora 2(표준 모델)는 720p 기준 생성된 비디오 초당 $0.10입니다. Sora 2 Pro는 720p 기준 초당 $0.30, 1024p 기준 초당 $0.50입니다. 일반적인 10초 클립은 표준 모델에서 $1.00, Pro의 HD에서 $5.00입니다. 생성 시간은 비동기이며, 5–10초 클립 기준 실제 경과 시간 30–90초를 예상하세요. 접근에는 최소 사용 티어 2의 유료 OpenAI 계정이 필요합니다.
2026년의 Sora API 접근 현황
Sora 2는 2025년 10월 7일 OpenAI API에 출시되었고, 이후 지속적으로 접근 가능합니다. 모델 식별자는 sora-2(현재 스냅샷 ID는 sora-2-2025-12-08)이며, 더 높은 화질의 변형은 sora-2-pro입니다. 둘 다 텍스트-투-비디오와 이미지-투-비디오 생성을 지원하며, 오디오 출력이 동기화됩니다. 2026년 1월 10일 기준 ChatGPT 제품의 무료 등급 소비자 접근이 중단되면서, 개발자급 Sora 사용은 유료 ChatGPT 구독 또는 직접 API 접근으로 집중되었습니다.
Sora를 프로그래밍적으로 사용하는 경로는 세 가지입니다:
- OpenAI 직접 API. 정석적인 경로. 초당 과금, 유료만 지원, Sora 모델 접근을 열기 위해 최소 $10 충전으로 사용 티어 2 달성이 필요. SDK와 REST API 모두 지원.
- Azure OpenAI. Microsoft의 엔터프라이즈 경로로, Azure 구독 오버헤드 및 엔터프라이즈 컴플라이언스 기능을 추가해 OpenAI의 공식 요금을 반영. 동일한 초당 과금, 운영 표면은 상이.
- 애그리게이터. 자체 통합 API 뒤에 Sora를 노출하는 서비스들. 대부분은 OpenAI의 초당 가격을 동일하게 패스스루하며, 가치는 운영적(하나의 자격증명, 하나의 청구서, 텍스트 모델 트래픽과 동일한 SDK)에 있습니다. 일부 애그리게이터는 자체 요금제를 제공하며, 이에 대해서는 글 후반에서 다룹니다.
Sora 2: 비디오 초당 가격
Sora 가격은 모델 티어와 출력 해상도에 따라 초당 요금이 정해지고, 클립 길이에 곱해 생성 비용이 산출됩니다. 2026년 5월 기준 OpenAI 공식 가격 페이지에서 확인:
| Model | Resolution | Supported durations | Price per second | 10-second clip |
|---|---|---|---|---|
| Sora 2 (standard) | 720p | 4s, 8s, 12s | $0.10 | $1.00 |
| Sora 2 Pro | 720p | 10s, 15s, 25s | $0.30 | $3.00 |
| Sora 2 Pro | 1024p (1792×1024) | 10s, 15s, 25s | $0.50 | $5.00 |
Notes on the pricing structure. 과금은 출력 기준이며 입력 기준이 아닙니다. 텍스트 모델과 달리 Sora에는 토큰 기반 입력 과금이 없습니다. 이미지 컨디셔닝(생성을 고정하기 위한 참조 이미지를 전달)은 초당 요금을 변경하지 않습니다. 각 모델 티어에 허용되는 길이는 고정되어 있습니다. 표준 모델에 7초 클립을 요청할 수 없으며 4, 8, 12초만 가능합니다.
명시할 가치가 있는 두 가지 실무적 함의. 첫째: 과금 모델은 LLM 청구서라기보다 비디오 렌더링 청구서에 가깝습니다. 비용은 프롬프트의 복잡성이나 토큰 수가 아니라 출력 길이에 의해 좌우됩니다. 둘째: HD에서 Sora 2와 Sora 2 Pro의 초당 비용 차이는 5배입니다. 10초 클립은 표준에서 $1.00, Pro의 1024p에서는 $5.00입니다. 작업에 맞는 티어 선택이 가장 큰 비용 레버이며, Pro의 높은 충실도가 정말 필요한 워크로드를 신중히 구분할 가치가 있습니다.
레이트 리밋과 쿼ота
Sora 레이트 리밋은 OpenAI의 표준 사용 티어 시스템을 따릅니다. Sora에 특화된 요점:
- 최소 티어 요구 사항: 티어 2. API 크레딧 최소 $10 충전으로 달성. 티어 1(신규 계정 기본값)에는 Sora 모델 접근이 포함되지 않습니다.
- 동시 생성 제한: OpenAI 레이트 리밋 문서 기준, 동시 비디오 생성은 티어에 따라 제한됩니다. 하위 티어에서는 진행 중인 생성 수가 소수로 제한되고, 사용 티어가 올라가며 확장됩니다. 정확한 상한은 계정별로 설정되며 OpenAI 대시보드에서 확인 가능합니다. 대규모 워크로드에는 1일 차부터 티어 3 또는 티어 4를 계획하세요.
- 쿼ота 증액 요청: 기본 티어 상한을 넘는 더 높은 동시성은 OpenAI 레이트 리밋 증액 요청 양식을 통해 요청할 수 있습니다. 승인 여부는 워크로드별이며 즉시 이뤄지지 않습니다. 출시일 수요 급증이 예측되는 프로덕션 배포라면 몇 주 전에 증액을 요청하세요.
알아둘 점: Sora의 레이트 리밋은 동일 계정의 텍스트 모델 레이트 리밋과 별도로 풀링됩니다. Sora 트래픽이 많다고 해서 GPT-5.5 호출에 사용 가능한 레이트 예산이 줄지 않습니다. 반대로 GPT-5.5 트래픽이 커져도 Sora 예산을 소모하지 않습니다. 두 가지를 별개의 용량 계획 과제로 다루세요.
생성 시간: 실제로 기대할 수 있는 것
Sora는 설계상 비동기입니다. 생성 요청을 제출하면 잡 ID를 받고, 완료 시점까지 폴링(또는 웹훅 콜백)을 합니다. 요청과 완료 사이의 실제 경과 시간은 출력 길이와 해상도, OpenAI 인프라의 현재 부하, 그리고 계정에서 앞서 대기 중인 잡 유무에 따라 달라집니다.
관찰된 동작을 바탕으로 한 현실적인 기대치:
| Output | Typical wall-clock time | Notes |
|---|---|---|
| Sora 2 standard, 4s @ 720p | 20–45 seconds | 가장 빠른 경로; 반복 작업에 적합 |
| Sora 2 standard, 8s @ 720p | 40–90 seconds | 가장 흔한 프로덕션 길이 |
| Sora 2 standard, 12s @ 720p | 60–120 seconds | 소셜용 중장형 콘텐츠 |
| Sora 2 Pro, 10s @ 720p | 60–150 seconds | 프리미엄 품질; 표준 대비 비용 약 3배 |
| Sora 2 Pro, 15s @ 1024p | 120–240 seconds | Full HD, 피크 시 대기열 증가 관찰 |
| Sora 2 Pro, 25s @ 1024p | 200–360 seconds | 최대 길이; 가격은 선형으로 증가 |
두 가지 운영상의 결과:
- 사용자 지향 지연 예산을 다시 생각해야 합니다. 사용자 행동에 즉시 반응하는 느낌을 기대하는 제품이라면, 짧은 클립도 30–90초가 걸릴 수 있으므로 대기 시간을 처리하는 UX가 필요합니다. 진행 표시, 생성 중 사용자가 병렬로 할 수 있는 작업, 예측 가능한 시나리오에 대한 사전 생성이 대표적입니다. Sora를 동기식 API 호출처럼 다루는 것이 팀들이 가장 흔히 하는 아키텍처 실수입니다.
- 폴링 대 웹훅은 중요합니다. 상태 엔드포인트를 촘촘히 두드리는 순진한 폴링은 레이트 리밋 예산과 모델의 컴퓨트 모두를 낭비합니다. 지터를 포함한 지수 백오프를 사용하거나, 환경이 지원한다면 웹훅 콜백을 설정하세요. 프로덕션에서 잘 작동하는 폴링 패턴은 처음 1분 동안 10초 간격, 그 이후 30초 간격으로 폴링하고, 요청 길이에 대한 모델의 예상 상한에서 하드 타임아웃을 거는 방식입니다.
지원 파라미터와 프롬프트 구조
Sora의 API 표면은 DALL-E 3 같은 이미지 생성 모델에 비해 의도적으로 단순합니다. 조절할 다이얼이 적지만, 존재하는 다이얼은 중요합니다. 핵심 파라미터:
- model: sora-2 또는 sora-2-pro. 위의 가격표에 따른 가격과 사용 가능한 길이/해상도를 결정합니다.
- prompt: 장면을 설명하는 자유 형식 텍스트. Sora는 시네마틱 연출(카메라 앵글, 움직임, 조명), 캐릭터 동작, 환경 디테일을 처리합니다. 모델은 프롬프트 구조에 민감합니다. 장면 설정 → 액션 → 기술적 연출 순으로 이끌어 가면 단일 밀집 문단보다 결과 일관성이 높습니다.
- image: 선택적 참조 이미지로 이미지-투-비디오 생성에 사용. 참조 이미지는 첫 프레임의 앵커 역할을 하며, 모델은 그 지점에서 움직임을 생성해 나갑니다. 제품 데모, 캐릭터 연속성, 피사체의 정적 외형이 비변경 조건인 시나리오에 유용합니다.
- duration: 초 단위 길이. 선택한 모델의 이산 옵션에 의해 제한됩니다(sora-2는 4/8/12, sora-2-pro는 10/15/25). 비용은 길이에 선형적으로 비례합니다.
- size: 해상도. 표준 모델은 720x1280(세로) 또는 1280x720(가로); Pro는 1024x1792 / 1792x1024가 추가됩니다. 종횡비는 size 선택에 내재합니다.
Notable absences. Sora는 현재 퍼블릭 API에서 시드 제어를 노출하지 않아 실행 간 재현성이 보장되지 않습니다. 또한 Midjourney 등 다른 이미지 모델처럼 개별 스타일 컨트롤도 노출하지 않습니다. 모델은 의견이 분명하며, 파라미터 튜닝이 아니라 프롬프트 엔지니어링이 주된 레버입니다.
A simple example of a Sora 2 generation request, using the OpenAI Python SDK:
| from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# 비디오 생성 작업 생성job = client.videos.create(model="sora-2",prompt=("해 뜨는 무렵, 눈 덮인 산을 와이드 앵글로 촬영. ""첫 햇살이 정상에 비칠 때 카메라가 천천히 왼쪽으로 트래킹. ""시네마틱, 골든 아워, 4K급 라이팅."),size="1280x720",duration=8,)# 완료 여부 폴링while True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"생성 실패: {job.error}")print(f"현재 상태: {job.status}")time.sleep(10)print(f"비디오 준비 완료: {video_url}") |
|---|
비용 계산 예시
초당 과금 구조는 워크로드 형태가 명확해지면 예측 가능합니다. 대표적 세 가지 시나리오:
시나리오 1: SaaS 랜딩 페이지용 짧은 제품 데모
제품 UI가 동작하는 모습을 보여주는 5초 클립 한 편을 생성해 마케팅 사이트의 히어로 비디오로 사용. 퍼블리시 전 만족할 만한 클립을 얻기 위해 5–10회 반복을 예상.
720p의 Sora 2 표준에서 비용: 5s × $0.10 = $0.50(회당). 최종 컷에 도달하기까지 8회 반복 시: $4.00. 최종 퍼블리시 버전을 1024p의 Sora 2 Pro에서 생성: 5s × $0.50 = $2.50(단일 테이크). 전체 프로젝트 비용: 반복 실행 + HD 최종본 합계 대략 $6.50.
시나리오 2: 마케팅 캠페인을 위한 50개 배치 클립
각기 다른 기능 설명을 기반으로 한 고유 8초 제품 클립 50개. 모두 720p의 Sora 2 표준 사용. 반복 예산 없음: 첫 생성 결과를 수용.
비용: 50 × 8s × $0.10 = $40.00. 첫 시도에 실패한 클립을 위해 30% 반복 예산 추가(50 × 0.30 = 15회 재시도 × 8s × $0.10 = $12). 합계: 캠페인 총 약 $52.00.
시나리오 3: 소비자 제품의 사용자 생성 비디오 기능
앱에서 사용자가 720p의 Sora 2 표준으로 6초 클립을 온디맨드로 생성. 평균 사용량: 하루 1,000클립. 1회 생성당 사용자에게 $0.50를 청구하고, 비용 차이를 단위 마진으로 수용.
사용자 클립 1건당 비용: 6s × $0.10 = $0.60. 사용자 가격이 $0.50일 경우 표준 티어에서는 워크로드가 손실입니다. 720p 표준 티어에서 손익분기점을 맞추려면 인프라 오버헤드 이전 기준 최소 $0.65의 사용자 가격이 필요합니다. 월 30,000클립일 때: 월 Sora 청구서 약 $18,000. 사용자 지향 비디오 기능 출시 전 반드시 이런 단위 경제성 점검이 필요합니다.
The takeaway across the three scenarios: 비디오 생성은 반복 횟수가 제한되고 “최종 자산당 비용”이 중요한 마케팅·일회성 콘텐츠 워크로드에서는 충분히 감당 가능한 비용입니다. 반면 대규모 사용자 지향 기능에서는 “생성당 비용”이 사용자 과금 + 제품 오버헤드를 넘어야 하므로 훨씬 도전적입니다. 커밋 전에 자신이 가격 책정 중인 워크로드가 무엇인지 명확히 하세요.
OpenAI 직접 접근 vs 애그리게이터 접근
Sora에 여러 경로로 접근 가능한 상황에서, 대부분의 팀에게 실무적인 질문은 어떤 경로를 통합할 것인가입니다. 정답은 스택의 나머지에 달려 있습니다.
동일한 것
출력 품질, 모델 레이어에서의 생성 시간, 지원 파라미터, 초당 과금은 경로와 무관하게 보통 동일합니다. 대부분의 애그리게이터가 OpenAI의 초당 가격을 동등하게 패스스루하고, 사용하는 모델도 동일하기 때문입니다. 오로지 출력 품질만으로 경로를 선택한다면 선택의 차이는 없습니다.
다른 것
- 과금 방식. OpenAI 직접 접근은 OpenAI 계정으로 청구되며, 애그리게이터는 자체 크레딧/구독 시스템을 통해 청구합니다. 이미 텍스트 모델 사용에 대해 OpenAI 과금을 관리하는 팀에는 직접 경로가 새로운 요소를 더하지 않습니다. Anthropic의 LLM, Black Forest Labs의 이미지 모델, Sora의 비디오 등 멀티 프로바이더 워크로드를 운영하는 팀에는 애그리게이터가 모든 것을 한 청구서로 통합합니다.
- 가시성. OpenAI 대시보드는 Sora 사용량을 요청 단위로 명확히 제공합니다. 애그리게이터 대시보드는 비디오 생성 워크로드를 얼마나 잘 다루는지 편차가 있습니다. 어떤 곳은 비디오 전용 가시성을 제공하고, 어떤 곳은 비디오를 일반 API 호출로 취급합니다. 가시성이 우선이라면 커밋 전에 확인할 가치가 있습니다.
- 레이트 리밋 풀링. OpenAI 직접 접근에서는 Sora 레이트 리밋이 OpenAI 계정과 티어에 묶입니다. 애그리게이터에서는 고객 기반 전체에 풀링되거나 고객별로 할당되기도 합니다. 대규모 프로덕션 워크로드라면 통합 전에 애그리게이터의 레이트 리밋 할당 방식을 반드시 문의하세요.
- 지역/컴플라이언스 체계. OpenAI 직접 접근은 OpenAI 인프라로 처리되며, OpenAI가 제공하는 데이터 거주지 옵션을 따릅니다. 일부 애그리게이터는 데이터 거주지 규정이 다른 관할에 기반하고, 다른 곳은 요청을 미국 OpenAI 인프라로 라우팅합니다. 규제 대상 워크로드에서는 결정적 요소이며, 서면 확인을 애그리게이터 영업팀에 요청할 가치가 있습니다.
CometAPI는 어디에 맞는가
CometAPI는 단일 OpenAI 호환 엔드포인트 뒤에서 하나의 자격증명과 통합 과금으로 Sora 2와 Sora 2 Pro를 포함한 500+ 모델을 제공합니다. CometAPI의 Sora 가격은 OpenAI의 초당 요율을 추적하며, 운영적 가치는 Sora 사용량을 나머지 모델 트래픽과 함께 한 청구서로 통합하는 데 있습니다. 멀티 프로바이더 텍스트 모델, 이미지 생성, Sora 비디오 등 혼합 워크로드를 운영하는 팀에 특히 설득력이 있습니다. 오직 Sora와 한두 개 텍스트 모델만 사용하는 팀이라면 운영적 절감폭이 작아 OpenAI 직접 접근도 충분히 방어 가능한 선택입니다.
프로덕션 고려 사항
Sora를 프로덕션 트래픽에 연결하기 전에 반드시 올바르게 갖추어야 할 패턴 몇 가지:
- 비동기 잡 라이프사이클 처리. 각 Sora 생성을 요청이 아닌 장기 실행 잡으로 취급하세요. 생성 직후 잡 ID를 영구 저장하고, 서버 재시작에도 진행 중인 잡의 폴링을 재개할 수 있어야 하며, 워커 오프라인 중 잡이 완료되는 경우도 처리하세요. 분산 시스템의 표준 위생이지만, 팀의 첫 비동기 API 통합이 Sora인 경우 초기에는 종종 생략됩니다.
- 웹훅 우선, 폴링은 폴백. 플랫폼이 완료 이벤트용 웹훅을 지원한다면 사용하세요(OpenAI API는 지원합니다). 웹훅은 폴링이 필요 없고 레이트 리밋 압박과 빈번한 상태 조회로 낭비되는 컴퓨트를 줄여줍니다. 웹훅 엔드포인트를 노출할 수 없는 환경에서는 폴링을 폴백으로 사용하세요.
- 비용이 드는 실패 모드. OpenAI는 실패한 생성에 대해 과금하지 않지만, 부분 완료나 재시도 후 두 번째 시도에서 성공하면 비용이 발생합니다. 프로덕션에서는 각 재시도의 비용을 로깅하고, 재시도율이 예상치를 넘으면 알림을 보내세요. 이는 대개 전송하는 프롬프트의 콘텐츠 정책 이슈 신호이며, 청구서를 감수하는 것보다 프롬프트 레이어에서 수정하는 편이 저렴합니다.
- 콘텐츠 정책과 프로덕션 배포. Sora는 특정 콘텐츠 범주를 제한하는 OpenAI의 사용 정책에 의해 제한됩니다. 프로덕션 배포(특히 프롬프트가 일부 사용자 통제 하에 있는 사용자 지향 제품)에서는 OpenAI 공식 콘텐츠 정책 문서를 검토하고 상위 가드레일을 설계하세요. 정책 문서가 정답이며, 이 글보다 변경 주기가 짧으므로 해당 문서를 참조하는 것이 맞습니다.
무엇부터 만들 것인가
오늘 프로덕션에 적합한 Sora 워크로드, 경계선 워크로드, 시기상조 워크로드에 대한 솔직한 평가:
오늘 당장 프로덕션 적합
반복 횟수가 제한되고 최종 자산당 비용이 맞는 마케팅/크리에이티브 콘텐츠 워크로드. 제품 데모 영상, 소셜 캠페인 콘텐츠, 랜딩 페이지 히어로 비디오, 내부 교육 자료. 경제성이 맞고 실패 모드도 잘 이해되어 있으며, 인력 개입이 있는 콘텐츠 팀에서는 30–90초의 지연도 수용 가능합니다.
경계선
클립당 비용이 사용자 과금을 넘어야 하는 사용자 지향 비디오 생성 기능. 가능하지만 단위 경제성에 세심한 주의가 필요합니다. 사용자가 요청할 수 있는 길이를 제한하고, 기본은 720p의 Sora 2 표준으로 설정하며, 클립당 비용보다 마진이 남는 가격을 책정하세요. 2026년 초반의 소비자 비디오 생성 앱 물결은 대부분 이 범주에 속하며, 경제성을 지속한 사례는 사용자 생성 가능 범위를 의도적으로 제한했습니다.
시기상조
대규모 장편(현재 Sora의 길이 상한인 25초를 넘는 모든 것), 달리 비용보다 벽시계 지연이 더 중요한 고용량 실시간 시나리오, 프레임 단위 제어나 시드 기반 재현성이 필요한 애플리케이션. 이는 Sora의 기능 표면이 확장될 때 다시 볼 워크로드이지, 오늘 억지로 맞출 대상이 아닙니다.
The framing: Sora 2는 사람의 개입이 있는 콘텐츠 워크로드에 대해서는 진정으로 프로덕션 준비가 되어 있습니다. 의도적인 단위 경제성을 전제로 사용자 지향 기능에도 적용 가능합니다. 장편 비디오나 아직 노출되지 않은 파라미터가 필요한 용도에는 시기상조입니다. 오늘 준비된 것에 맞춰 빌드하고, 아직 준비되지 않은 것들은 추적하세요.
Trying it on your workload: 모든 Sora 2 및 Sora 2 Pro 변형은 여러분이 이미 사용 중일 수 있는 텍스트 모델과 함께 CometAPI에서 제공됩니다. 무료 체험 크레딧으로 표준 가격의 클립 몇 개를 생성해 볼 수 있으며, 기존 OpenAI 호환 클라이언트를 CometAPI 엔드포인트로 향하게 하는 것 이상의 설정은 필요하지 않습니다.
