五個提供商儀表板。三組 API 金鑰。兩本輪換行事曆。多供應商 AI 工作的摩擦不會出現在任何預算項目上——它表現在你需要多久才能交付任何東西,以及你選擇不再嘗試的那些事,因為設定成本不值得。
早上 9 點的儀式
打開筆電。咖啡。查收郵件。打開 OpenAI 儀表板,看昨天的支出,點進任何警報。打開 Anthropic 主控台,查看可用額度,確認上週的組織管理員邀請是否已處理。打開 Google AI Studio,查看昨晚你跑的 Agent 測試之速率限制用量。若有在 Replicate 或 Fireworks 上跑的副專案,也許再開一下。現在打開 1Password 確認憑證自週五以來沒有輪換。
這是多數在 AI 上構建的開發者不會提起的早晨片段。正事之前的前置工作。那 8–15 分鐘跨儀表板檢查,之所以滲入每天,是因為沒有人為它設計——它只是自然浮現,一個提供商註冊接著一個,直到變成常態。等你開始做原本計畫要做的事,你已經支付了一筆生產力稅:無法記帳、也無法追回。
沒有人真正坦承的事: 大多數運行多供應商 AI 工作負載的開發者,不知不覺把這套流程內化進了每天。它感覺像是「只是隨時掌握情況」。其實是每天累積的情境切換成本,而生產力文獻幾十年來一再指出,這種分散的注意力正是扼殺交付速度的元兇。
放緩不是抽象的。它具體體現在三方面:簡單變更需要更久、在定案前你實際評估的模型更少、以及你停止嘗試的那些事,因為設定成本讓它不值得。這些成本不會出現在預算行裡。但它們都是真實存在,多數運行多供應商堆疊的團隊對它們的低估往往達到一個數量級。
生產力稅實際藏在哪裡
如果你問一位運行多供應商 AI 堆疊的開發者:「管理你的 API 金鑰有讓你變慢嗎?」坦誠的答案通常是「不太會」。每個摩擦都很小——這裡登入 30 秒,那裡情境切換 90 秒,一週一次找憑證 5 分鐘。沒有一件事會讓你覺得是吞噬一週的元兇。它們看起來像是在「維持基本運轉」。
成本之所以難以看見,就是因為它是用足以被忽略的小刻度支付的,散落在足夠多的觸點上,沒有一個特別顯眼,且發生得足夠頻繁,以至於你已停止察覺摩擦。生產力研究把這稱作「注意力殘留」——當你切換到下一個情境時,上一個情境仍殘留的一小段注意力。儀表板本身不是成本。累積起來的注意力殘留才是。
每天的四個摩擦點
四個特定觸點是成本累積之處。每一個都很小。四個加總起來,就是工作天中有感的一塊時間。
- 新專案啟動時的憑證查找。 你開了一個新的客戶專案或新功能分支。第一件需要的是正確的 API 金鑰——取決於這次要呼叫哪個提供商。這意味著打開你的密鑰管理器,找到正確的條目,把正確的金鑰複製到正確的設定檔,並再次確認環境(dev / staging / prod)正確。在多供應商堆疊中,這每個提供商都要來一次。每次摩擦都很小,但一年下來的專案會把它累積起來。
- 除錯時的儀表板導航。 一個請求失敗了。是速率限制?模型被棄用?認證問題?內容政策拒絕?找答案需要去相應提供商的儀表板,定位請求記錄,並閱讀該提供商格式的錯誤。每家提供商組織方式都不同。OpenAI 的記錄呈現方式不同於 Anthropic,也不同於 Google。直到今天第三次切換不同的儀表板布局,你才會注意到情境切換的成本。
- 跨提供商解讀速率限制。 每個提供商用不同單位表達限制。OpenAI 用 tokens-per-minute 與 requests-per-minute。Anthropic 用 input tokens per minute 與 output tokens per minute 作為分開的上限。Google 用 requests-per-minute 與 tokens-per-day。當你打到限制時,你的除錯路徑取決於你在看哪家提供商——而你要套用的思維模型也是提供商特定的。這個摩擦點在事件回應時咬得最痛,因為那時你慢不起來。
- 閱讀 API 參考時切換文件。 你要在兩個提供商間實作工具使用。OpenAI 文件把 tool use 結構成具特定綱要的函式。Anthropic 文件把它結構成 tool_use 區塊,各有其綱要。兩邊都要讀,分頁間來回切換,在兩個格式間心智轉譯——這正是摧毀專注的認知負荷。半小時的文件分頁來回,體感像十分鐘;實際時間損耗更接近 45 分鐘。
這些個別看都不至於災難。真正的災難是:它們每天都在發生、一天好幾次,而且疊加在你原本計畫要做的工作之上。交付速度的代價是這些小中斷的總和,乘上你一年裡用這種方式工作的工作天數。
在兩種設定下,一小時的工作實際長什麼樣
最清楚的比較方式,是把同一小時的工作放在兩種不同設定下:一個是三家提供商的整合分別管理;一個是以 一組憑證 走在單一、相容於 OpenAI 的端點後面。任務相同,開發者相同,產出相同——但達成所需的工作量不同。
任務: 實作一個新功能:主要生成使用 Claude Sonnet 4.6;若 Claude 觸發速率限制,回退到 GPT-5.5;並用 Gemini 3.1 Pro 對回應做結構化擷取。跨提供商工作流程——在 2026 年已成常態的那種。
| Step | Multi-provider setup | Single-endpoint setup |
|---|---|---|
| Get the right credentials into the project | 打開三個提供商的儀表板、三個密鑰管理條目。~6 分鐘。 | 複製一把 API 金鑰。~30 秒。 |
| Install and configure SDKs | 安裝與設定 SDK:Anthropic SDK(已為其他工作安裝)。Google AI SDK(安裝 + 閱讀認證文件)。OpenAI SDK(已安裝)。~15 分鐘。 | OpenAI SDK 已安裝。更改 base_url。~30 秒。 |
| Implement the three calls | 三種不同的請求結構、三種不同的回應解析器、三種不同的錯誤型態。~25 分鐘。 | 三個模型共用相同的請求結構。~10 分鐘。 |
| Test that fallback works end-to-end | 一直打到 Claude 被速率限制(或模擬該錯誤)。驗證回退。~12 分鐘。 | 相同邏輯,但針對一個端點,錯誤語義一致。~5 分鐘。 |
| Total | ~58 分鐘 | ~16 分鐘 |
差了 40 分鐘並不是重點。重點是,多供應商設定讓你在一小時內有三次情境切換——而這種切換成本不會出現在工時表上,卻真真切切影響你到週五能交付多少。單一端點設定讓你維持在一個心智模型中:一個 SDK、一個錯誤表面、一套約定。省下的 40 分鐘有一部分是字面上的時間;其餘則是你沒有在同一時間把三家提供商的怪癖都塞進腦袋時,沒有累積起來的注意力殘留。
浮現的模式: 在多供應商堆疊上,簡單的跨模型功能實作所需時間約為統一端點設定的 3–4 倍。這個比例在簡單與複雜任務中都成立。原因不是原始難度,而是每一步都在三家提供商的約定之間切換所帶來的認知負荷。
當每日儀式變短後會發生什麼
成本是以小刻度累積的。當你移除成本,收益也是以小刻度累加——但會朝另一個方向複利。開發者若每天取回 30 分鐘免於破碎的情境切換,每週能多出約兩個半小時可用時間。以年計,約等於三個完整工作週的生產力回收。被取回的時間並非唯一收益,甚至可以說不是最重要的。實務上更重要的是三個次級效應。
你會做更多實驗,因為實驗變便宜了
在多供應商設定下,嘗試一個新模型意味著經歷一套 整合流程:如果沒有帳號就先註冊、加入憑證、若是新 SDK 就安裝、寫包裝器、部署。對多數開發者而言,「這個新模型值得試嗎?」的門檻大約是半天成本。沒過這條線的,就不會被嘗試。
在單一端點設定下,嘗試一個新模型是一個設定變更。改程式裡的 model 參數、部署、跑你的評估套件、比較。門檻從半天降到十分鐘。跑在聚合端點上的團隊,針對同一工作負載會多測試 3–5 倍的模型選項——而他們最後選到的更合適模型,也反映了更廣的探索。你會做更多實驗,因為實驗變得便宜。
新模型發布時你能更快行動
在 2026 年,這比一年前更重要。新的前沿模型每隔幾週就會發布。有時它們會在你已經上線的負載上,實質改變價格—品質前沿。在多供應商直連設定下,評估新模型意味著設定新提供商(或把新模型接進現有提供商整合,或跟著 SDK 變更把新模型穿透到位)。等你拿到公平比較,兩週過去了,先行者優勢也沒了。
在單一端點設定下,新模型通常會在公開發布後數小時內出現在聚合器的型錄裡。測試它是一個 model 參數變更。當天就有比較。這會在一年裡持續累積——跑在聚合端點的團隊更常在各自負載上使用「正確」的模型,因為當出現更合適的選擇時,切換成本不再是決定性因素。
你重新掌控自己的時間
多供應商日常流程中最難言明的成本,也是當它消失時開發者感受最強烈的一點。每天 8–15 分鐘的儀表板檢查、憑證查找、跨提供商情境切換,不只是時間——還是與你真正想構建的東西無關的維護性工作。當那些時間消失,早晨會以不同的方式開始。你打開筆電,第一件事就是構建。對於如何開始一天重新擁有主導權,遠比字面上省下的分鐘數更重要,而這正是已完成轉換的開發者一致認為最有感的改變。
第一天的習慣轉變
如果你目前在跑多供應商設定,而上述成本讓你感同身受,遷移主要是「先移哪些工作負載」的問題。以下是一些實作上的框架,說明這個改變實際如何展開:
- 第一個搬遷的是新功能,而不是現有功能。 選一個你尚未開始構建的功能,把它指向單一端點設定,並用這個流程把它交付。你會在沒有遷移成本的情況下學會新模式——無需重建現有整合、無需冒生產流量風險。功能上線時,你就知道這套工作流程是否適合你。
- 第二步是你的原型環境。 無論你用什麼來測試新模型對你的負載——你的 評估框架、你的提示迭代筆記本、你的 A/B 比較腳本——下一個把它移到單一端點設定。這裡會最先出現實驗收益,也是門檻從「半天整合」降到「設定變更」最明顯的地方。第一週內你就會開始嘗試更多模型。
- 既有生產工作負載最後再動,且不一定都要動。 如果你有單模型的生產工作負載,透過直接提供商接入——而且穩定、量大,並享有協商的企業定價——那條路徑可能繼續維持現狀更好。聚合器模式是為適配的工作負載而設;不適配的可以維持原樣。多數採混合設定的團隊,最後會讓聚合器處理多模型與實驗性工作,單模型的生產路徑則走直接提供商。
- 「儀表板習慣」大約需要兩週才會改掉。 在新設定的前一兩週,你仍會打開 OpenAI 的儀表板——這是習慣,不是必要。到了第三週,肌肉記憶已轉換,早晨流程從工作開始,而不是跨儀表板檢查。被取回的時間不會從第一天就全數到位;它會隨新習慣的建立而累積。
這對你意味著什麼
多供應商 AI 並不是因為每個提供商都不好而變成問題。每個提供商都沒問題。問題在於你同時跑了三四家時會發生什麼——情境切換成本、憑證面、文件交叉比對、儀表板碎片化。任何一項單看都不致命。致命的是:它們每天都在發生、一天多次,還疊在你原本計畫的工作之上。
務實的下一步: 計時一週。每次你打開某個提供商儀表板、在提供商文件間切換、或查找一個憑證,就記上一筆。週末把分鐘數加總。多數運行多供應商堆疊的開發者都會對總數感到意外——而與單一端點設定的比較會不言自明。配套文章《500 Models, One Endpoint: What That Actually Means for Your Stack》討論的是同一決策的架構面;本文講的是與它一起生活是什麼感覺。
多供應商 AI 的成本付在破碎的注意力上,而不是 API 花費上。回收發生時,會體現在三個地方:你早晨被取回的時間、你原本會跳過但如今會嘗試的模型、以及你對如何開始一天的主導權。這些都不會出現在預算行裡。三者都是真實存在,完成轉換的開發者一致將它們的價值置於字面上省下的小時數之上。
