2026 年的 Sora API 存取：定價、速率限制，以及透過聚合平台實際可用的內容

Sora 2 是 OpenAI 首個普遍可用的文字轉影片模型，可透過官方 OpenAI API 與日益增長的聚合器路由以程式方式存取。其計費方式不同於文字模型（按生成影片的秒數計費，而非按 token），因此在整合前，開發者所要詢問的實務問題也與 LLM API 不同。究竟一段影片要花多少錢？生成需要多久？速率限制為何？透過聚合器而非直接使用 OpenAI 會有什麼不同？

本文是我們在規劃自家影片生成功能時希望能有的參考。內容面向已經不再停留於「Sora 有沒有趣？」而是需要回答「要花多少、整合要花多久、在承諾投入之前我需要知道什麼？」的開發者。

快速瀏覽： Sora 2（標準模型）在 720p 的價格為每秒 $0.10。Sora 2 Pro 在 720p 為每秒 $0.30，在 1024p 為每秒 $0.50。典型 10 秒片段：標準模型 $1.00；Pro 的 HD 為 $5.00。生成時間為非同步；5–10 秒片段的實際耗時約 30–90 秒。存取需要付費的 OpenAI 帳戶且至少達到用量層級 Tier 2。

2026 年 Sora API 存取現況

Sora 2 於 2025 年 10 月 7 日在 OpenAI API 上推出，之後持續可用。模型識別子為 sora-2（目前快照 ID 為 sora-2-2025-12-08），高擬真變體為 sora-2-pro。兩者皆支援文字轉影片與圖片轉影片，並輸出同步音訊。截至 2026 年 1 月 10 日，ChatGPT 產品的免費層消費者存取已停止，這將開發者等級的 Sora 用量集中到付費 ChatGPT 訂閱或直接 API 存取。

以程式方式使用 Sora 的三條路徑：

OpenAI 直接 API。 正統路徑。按秒計費、僅付費、需至少儲值 $10 才能達到 Tier 2 並解鎖 Sora 模型存取。支援 SDK 與 REST API。
Azure OpenAI。 Microsoft 的企業路徑，費率與 OpenAI 官方相同，但附加 Azure 訂閱開銷與企業合規功能。相同的按秒定價；不同的操作面。
聚合器。 以自家統一 API 暴露 Sora 的服務。多數聚合器以與 OpenAI 同價轉售按秒計費；其價值在營運層面（單一憑證、單一帳單、與文字模型流量相同的 SDK）。也有少數聚合器提供自定資費，本文稍後討論。

Sora 2 以影片秒數計費的價格

Sora 的定價依模型等級與輸出解析度區分，以每秒費率乘以片段時長得出生成成本。以下為 2026 年 5 月自 OpenAI 官方定價頁面驗證：

模型	解析度	支援時長	每秒價格	10 秒片段
Sora 2（標準）	720p	4s, 8s, 12s	$0.10	$1.00
Sora 2 Pro	720p	10s, 15s, 25s	$0.30	$3.00
Sora 2 Pro	1024p (1792×1024)	10s, 15s, 25s	$0.50	$5.00

關於定價結構的說明。 計費依輸出而非輸入；Sora 不像文字模型有基於輸入 token 的計費。圖片條件（提供參考圖片以固定生成）不會改變每秒費率。各模型等級的時長選項是離散固定的：你無法在標準模型請求 7 秒片段，只能選 4、8 或 12 秒。

兩點實務含義值得明確。其一：定價模式更像影片渲染的帳單，而非 LLM 帳單。成本由輸出時長驅動，而非提示詞的複雜度或 token 數。其二：在 HD 下，Sora 2 與 Sora 2 Pro 的每秒成本差距為 5 倍：10 秒片段在標準為 $1.00，而在 1024p 的 Pro 為 $5.00。為任務選對等級是你最大也是最重要的成本槓桿，值得審慎評估哪些工作負載確實需要 Pro 的更高擬真度。

速率限制與配額

Sora 的速率限制依 OpenAI 標準用量層級系統組織。Sora 的要點如下：

最低層級要求： Tier 2，透過至少儲值 $10 API 點數達成。Tier 1（新帳號預設）不包含 Sora 模型存取。
並發生成限制： 依 OpenAI 速率限制文件，並發影片生成會受層級限制；較低層級通常僅允許少量同時進行中的任務，並會隨層級提升擴大。精確上限以帳戶為單位設定，並可於 OpenAI 控制台查看。若是高量工作負載，建議從第一天就規劃 Tier 3 或 Tier 4。
配額申請： 超過預設層級上限的更高並發可透過 OpenAI 的速率限制提升表單申請。核准會依工作負載具體評估，且不會即時；若是有明確流量高峰的正式上線，請於上線前數週提出申請。

還需要知道：Sora 的速率限制池與同帳戶的文字模型速率池分開。大量的 Sora 流量不會影響 GPT-5.5 可用的速率預算；反之亦然。請將兩者視為獨立的容量規劃問題。

生成時間：實際會遇到什麼

Sora 自設計上就是非同步。你提交生成請求，取得工作 ID，並透過輪詢（或 webhook 回呼）來取得完成通知。從請求到完成的實際耗時取決於輸出的時長與解析度、OpenAI 基礎設施當前負載，以及你的工作是否在帳戶內排隊等候。

根據實際觀察的合理預期：

輸出	典型實際耗時	備註
Sora 2 標準，4s @ 720p	20–45 秒	最快路徑；適合迭代
Sora 2 標準，8s @ 720p	40–90 秒	最常見的生產時長
Sora 2 標準，12s @ 720p	60–120 秒	偏長的社群內容
Sora 2 Pro，10s @ 720p	60–150 秒	高品質；成本約為標準版的 3 倍
Sora 2 Pro，15s @ 1024p	120–240 秒	Full HD，高峰期觀察到較長的排隊
Sora 2 Pro，25s @ 1024p	200–360 秒	最長時長；價格線性成長

兩個操作層面的結果：

需要重新思考用戶可感延遲預算。 若你的產品期望影片生成能對用戶操作即時回饋，短片段也有 30–90 秒的等待，這代表你需要能處理等待的 UX：進度指示、在生成期間讓用戶可並行進行的操作，或針對可預期情境預先生成。將 Sora 當成同步 API 來使用，是團隊最常見的架構錯誤。
輪詢與 webhook 的取捨很重要。 天真的緊密輪詢（頻繁打狀態端點）既浪費你的速率限制預算，也浪費模型算力。請使用帶抖動的指數退避，或在環境允許下設定 webhook 回呼。實務可行的輪詢策略是：前 1 分鐘每 10 秒輪詢一次，之後每 30 秒一次，並在該時長對應的上界設硬性逾時。

支援的參數與提示詞結構

相較於如 DALL·E 3 等影像生成模型，Sora 的 API 介面刻意保持簡潔。可調旋鈕較少，但每個都很重要。重點參數：

model： sora-2 或 sora-2-pro。此選擇同時決定價格與可用的時長／解析度，如上表所示。
prompt： 自由文字描述場景。Sora 能處理電影化指導（鏡位、運動、光線）、角色動作與環境細節。模型對提示結構相當敏感：先建立場景，再敘述動作，最後給技術指導，比單一密集段落更穩定。
image： 可選的參考圖片，用於圖片轉影片。此參考會作為第一幀的錨點；模型會從該起點向外生成動態。適用於產品展示、角色延續，以及任何主體外觀不可妥協的場景。
duration： 秒數。受限於所選模型的離散選項（sora-2 為 4/8/12，sora-2-pro 為 10/15/25）。成本與時長線性成長。
size： 解析度。標準模型支援 720x1280（直式）或 1280x720（橫式）；Pro 另增 1024x1792 / 1792x1024。長寬比由 size 隱含。

值得注意的缺項。 Sora 目前未在公開 API 提供 seed 控制（因此跨次執行的可重現性無保證），也未提供如 Midjourney 等影像模型那樣的獨立風格控制。模型本身較具主觀性；主要的調整槓桿在提示詞工程，而非參數微調。

使用 OpenAI Python SDK 的 Sora 2 生成請求簡例：

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# 建立影片生成工作job = client.videos.create(model="sora-2",prompt=("在日出時拍攝一座白雪皚皚山峰的廣角鏡頭。""當第一縷陽光照上山頂時，鏡頭緩慢向左移動。""電影感、黃金時刻、4K 等級的光效。"),size="1280x720",duration=8,)# 輪詢以等待完成while True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"生成失敗: {job.error}")print(f"目前狀態：{job.status}")time.sleep(10)print(f"影片已就緒：{video_url}")

成本範例

按秒計價讓成本可預測，但前提是你清楚自身工作負載的形狀。三個具有代表性的情境：

情境 1：SaaS 登陸頁的短產品示範

一段 5 秒的片段展示產品 UI 的使用，生成一次後作為行銷網站的主視覺影片。預計在發布前會迭代 5–10 次以取得滿意的片段。

在 Sora 2 標準 720p 的成本：5s × $0.10 = 每次 $0.50。若以 8 次迭代達成最終版本：$4.00。最終發布版使用 Sora 2 Pro 的 1024p：5s × $0.50 = $2.50（單次）。整體專案成本：約 $6.50（包含迭代與 HD 最終版）。

情境 2：行銷活動的一批 50 支片段

50 支各不相同的 8 秒產品片段，每支基於不同功能描述，全部使用 Sora 2 標準 720p。不預留迭代預算；接受第一版輸出。

成本：50 × 8s × $0.10 = $40.00。為沒命中的片段加入 30% 的迭代預算（50 × 0.30 = 15 次重試 × 8s × $0.10 = $12）。總計：約 $52.00。

情境 3：面向消費者產品的用戶自製影片功能

用戶在你的 App 中隨選生成 6 秒片段，使用 Sora 2 標準 720p。平均用量：每日 1,000 支。你向用戶每次收費 $0.50，並承擔成本差作為單位毛利。

每支用戶影片成本：6s × $0.10 = $0.60。用戶定價 $0.50 時，此工作負載在標準等級下為虧損：每次生成成本比用戶支付多 $0.10。要在 720p 標準等級打平（不含基礎設施開銷），用戶定價至少需 $0.65。每月 30,000 支：Sora 月費為 $18,000。這就是在上線任何面向用戶的影片功能前值得先做的單位經濟性檢查。

三個情境的結論： 對於行銷與一次性內容工作負載，影片生成確實負擔得起，因為迭代次數可控且重點是每個最終資產的成本。對大規模面向用戶的功能則挑戰更大，因為每次生成成本必須高於用戶支付價格並覆蓋產品開銷。承諾投入之前，請明確你所定價的工作負載。

直接使用 OpenAI 與透過聚合器的比較

在多種路徑都可使用 Sora 的情況下，多數團隊最實際的問題是該整合哪一條。老實說，這取決於你其餘的技術棧。

相同之處

輸出品質、模型層的生成時間、支援參數與按秒定價通常在任何路徑下都相同，因為多數聚合器以與 OpenAI 同價轉售，而且底層是同一個模型。若僅以輸出品質作為選擇依據，兩者沒有差異。

不同之處

計費面。 直接使用 OpenAI 會由你的 OpenAI 帳戶計費；聚合器則透過其自家點數或訂閱系統計費。已經管理 OpenAI 文字模型用量計費的團隊，走直連不會新增管理負擔。若你的工作負載橫跨多供應商（來自 Anthropic 的 LLM、Black Forest Labs 的影像模型、Sora 的影片），聚合器可將這些整合在同一張發票。
可觀測性。 OpenAI 的控制台能清楚地呈現 Sora 的請求級用量。聚合器的控制台在影片生成工作負載上的表現不一；有些具備專門的影片觀測能力，有些則把影片當一般 API 呼叫。若你重視可觀測性，上線前值得確認。
速率限制池化。 直接使用 OpenAI 時，Sora 的速率限制綁定你的 OpenAI 帳戶與層級。在聚合器上，限額有時會在其客群間池化，有時則按客戶分配。若是高量生產工作負載，整合前請詢問聚合器如何分配速率限制。
地理與合規姿態。 直接使用 OpenAI 會在其基礎設施處理，並依 OpenAI 提供的資料駐留選項。有些聚合器位於不同法域，其資料駐留規則也不同；另一些則無論如何都將請求路由到 OpenAI 的美國基礎設施。對受監管的工作負載而言，這一點具有決定性，值得要求聚合器的業務團隊書面說明。

CometAPI 的定位

CometAPI 透過單一與 OpenAI 相容的端點，將 Sora 2 與 Sora 2 Pro 與 500+ 其他模型一併提供，使用單一憑證與統一計費。CometAPI 上的 Sora 定價與 OpenAI 的每秒費率保持一致；其營運價值在於將 Sora 與你其餘的模型流量合併到一張帳單。對於運行混合工作負載（多家供應商的文字模型、影像生成與 Sora 影片）的團隊，這是核心理由。若只使用 Sora 與一兩個文字模型，營運面的節省較小，直接使用 OpenAI 也是合理選擇。

上線實務考量

在讓 Sora 接近正式流量之前，幾個值得先做好準備的模式：

非同步工作生命週期處理。 把每次 Sora 生成當成長時任務，而非請求。建立後立即持久化工作 ID；若伺服器重啟也能續接輪詢進行中的任務；也要能處理工作在你的工作器離線時已完成的情況。這是標準的分散式系統衛生，但常因 Sora 是團隊整合的第一個非同步 API 而在初期被忽略。
Webhook 後備方案。 若平台支援完成事件的 webhook（OpenAI API 有），請使用它。Webhook 可移除輪詢需求，降低速率限制壓力並避免頻繁狀態查詢造成的計算浪費。輪詢則作為無法暴露 webhook 端點環境的後備。
會花錢的失敗模式。 OpenAI 不會對失敗的生成計費，但部分完成與第二次嘗試才成功的重試會產生成本。在生產環境，請記錄每次重試的成本，並在重試率超出預期時告警，因為那通常是你傳送的提示詞觸發內容政策的信號，從提示層面修正通常比承擔帳單便宜。
內容政策與正式部署。 Sora 受 OpenAI 使用政策約束，限制某些內容類別。若要正式部署（尤其是面向用戶且提示部分由用戶控制），請審閱 OpenAI 官方內容政策文件並設計上游防護欄。以連結指向 OpenAI 政策作為參考是正確做法；該文件比本文更新更頻繁且是權威來源。

先做什麼

對哪些 Sora 工作負載今天已可上線、哪些在邊緣、哪些仍言之過早的務實看法：

今日可上線

行銷與創意內容的工作負載，迭代可控且關注每個最終資產的成本。產品示範影片、社群行銷活動內容、登陸頁主視覺影片、內部訓練素材。經濟可行、失敗模式已為人熟悉，且延遲（短片段 30–90 秒）在人在迴路的內容團隊情境下可接受。

邊緣可行

面向用戶的影片生成功能，必須讓每支片段的成本高於用戶支付。這是可行的，但需要謹慎的單位經濟性：限制可請求的時長、預設使用 Sora 2 標準 720p、訂價需高於每片段成本。2026 年初期的消費者影片生成 App 多屬此類，能達到可持續經濟性的產品普遍都嚴格限制用戶可生成的內容。

尚嫌過早

長影片的大規模場景（超過 25 秒，這是 Sora 目前的時長上限）、牆上時鐘延遲遠比成本重要的高量即時情境、以及要求逐幀控制或基於 seed 的可重現性的應用。等 Sora 能力面擴大後再評估，而非勉強塞入今天的能力範圍。

總結架構： 對於有人在迴路的內容工作負載，Sora 2 已真正達到生產可用。對於面向用戶的功能，在謹慎的單位經濟性下亦可行。對長影片與需要目前尚未暴露參數的用例則仍為時過早。為今天可行的場景而建；持續追蹤尚未成熟的那些。

試試看你的工作負載： 所有 Sora 2 與 Sora 2 Pro 變體皆可在 CometAPI 與你已使用的文字模型一同使用。免費試用點數可讓你以標準定價生成少量片段，所需設定僅是將你既有的與 OpenAI 相容客戶端指向 CometAPI 端點。