De beste AI-API-gateways in 2026: CometAPI, Portkey, LiteLLM en Cloudflare vergeleken

Het kiezen van een AI API-gateway is niet hetzelfde probleem als twee jaar geleden. In 2024 belden de meeste ontwikkelaars rechtstreeks naar OpenAI of zetten lokaal LiteLLM op. Nu zijn er gehoste opties met prijsdashboards, kredietlimieten per sleutel en modelcatalogi die tientallen providers beslaan. De categorie is genoeg gegroeid dat verkeerd kiezen betekent dat je later echt integratiewerk moet terugdraaien.

Dit artikel vergelijkt vier gateways die herhaaldelijk opduiken in discussies onder ontwikkelaars: CometAPI, Portkey, LiteLLM en Cloudflare AI Gateway. Het doel is niet om een winnaar aan te wijzen — elk is logisch voor een andere situatie — maar om uiteen te zetten wat elk daadwerkelijk doet, zodat je het hulpmiddel aan je use-case kunt koppelen.

Let op modelnamen: Modelidentifiers in dit artikel (zoals gpt-5.4, claude-opus-4-7) zijn platformidentifiers van CometAPI. Het zijn geen officiële namen van OpenAI of Anthropic, die eigen naamgevingsconventies hanteren.

Wat deze tools daadwerkelijk doen

Voordat we functies vergelijken, helpt het om precies te zijn over wat een AI API-gateway doet. Minimaal: hij zit tussen je applicatie en één of meer AI-providers, stuurt verzoeken door en geeft antwoorden terug. Daarbuiten lopen gateways sterk uiteen.

Sommige gateways — Cloudflare AI Gateway, bijvoorbeeld — zijn primair een pass-throughlaag die logging en caching toevoegt zonder je API-sleutel of prijsstelling aan te raken. Andere, zoals CometAPI, treden op als reseller: jij betaalt hen, zij betalen de onderliggende provider, en het prijsverschil is onderdeel van de waardepropositie. LiteLLM is weer anders — het is software die je zelf draait, geen gehoste service.

Dit onderscheid begrijpen is belangrijk voordat je een specifieke functie beoordeelt.

Functievergelijking

De onderstaande tabel gebruikt informatie uit de officiële documentatie of publieke dashboards van elk product per mei 2026. Functies gemarkeerd met een streepje (—) waren op het moment van schrijven niet bevestigd in officiële bronnen.

Functie	CometAPI	Portkey	LiteLLM	Cloudflare AI Gateway
Implementatie	Gehost (SaaS)	Gehost + zelf-host	Zelfgehost (open source)	Gehost (Cloudflare edge)
Modelcatalogus	500+ modellen over providers	1,600+ LLMs via unified API	Afhankelijk van je config	OpenAI, Anthropic, Workers AI
Prijsmodel	Reseller (je betaalt CometAPI)	Doorgifte + platformkosten	Alleen infrastructuurkosten	Doorgifte (gratis niveau beschikbaar)
OpenAI-compatibele API	Ja (api.cometapi.com/v1)	Ja (api.portkey.ai/v1)	Ja (lokaal of remote)	Ja (via gateway-URL)
Kredietlimieten per sleutel	Ja (dashboard)	Ja	Ja (via config)	—
Groepsgebonden prijsratio's	Ja (0.8x standaard, 0.1x intern)	—	—	—
Aanvraaglogging	Ja (4 logtypes)	Ja	Ja	Ja
Monitoring van succesratio	Ja (uptimeweergave 30 dagen)	Ja	Ja	Ja
Gratis niveau	Ja (nieuwe accounts)	Ja	Open source (infra-kosten)	Ja
Optie voor zelfhosting	Nee (enterprise: dedicated server)	Ja	Ja (kernuse-case)	Nee

Bronnen: CometAPI dashboard, Portkey homepage, LiteLLM GitHub, Cloudflare AI Gateway documentation

Verbinding maken met elke gateway

Alle vier gateways bieden een OpenAI-compatibele endpoint, wat betekent dat dezelfde clientstructuur voor alle werkt — je verandert de base_url, de inloggegevens, en in het geval van Portkey de manier waarop je het model specificeert.

Python

import osfrom openai import OpenAIdef require_env(name: str) -> str:    """Raise a clear error if a required environment variable is missing."""    val = os.environ.get(name)    if not val:        raise ValueError(f"Missing required environment variable: {name}")    return val# ── CometAPI ────────────────────────────────────────────────────────────────# Hosted reseller with 500+ models. Use CometAPI model identifiers (e.g. "gpt-5.4").cometapi_client = OpenAI(    base_url="https://api.cometapi.com/v1",    api_key=require_env("COMETAPI_KEY"),)# ── Portkey ─────────────────────────────────────────────────────────────────# Hosted gateway with observability and 1,600+ LLMs.# Route to a provider by prefixing the model name: "@openai/gpt-4o", "@anthropic/claude-3-5-sonnet", etc.# x-portkey-api-key is required; it authenticates requests to Portkey's gateway.portkey_client = OpenAI(    base_url="https://api.portkey.ai/v1",    api_key=require_env("PORTKEY_API_KEY"),    default_headers={        "x-portkey-api-key": require_env("PORTKEY_API_KEY"),    },)# ── LiteLLM ──────────────────────────────────────────────────────────────────# Self-hosted proxy. Provider credentials (OPENAI_API_KEY etc.) are set server-side.# By default the proxy does not validate the client API key — "anything" works.# If you have enabled virtual keys on your LiteLLM instance, pass a virtual key instead.litellm_client = OpenAI(    base_url=os.environ.get("LITELLM_BASE_URL", "http://localhost:4000"),    api_key=os.environ.get("LITELLM_API_KEY", "anything"),)# ── Cloudflare AI Gateway ───────────────────────────────────────────────────# URL-based pass-through. Keep your real provider API key — Cloudflare does not replace it.cf_account_id = require_env("CF_ACCOUNT_ID")cf_gateway_id = require_env("CF_GATEWAY_ID")cloudflare_client = OpenAI(    base_url=(        f"https://gateway.ai.cloudflare.com/v1"        f"/{cf_account_id}/{cf_gateway_id}/openai"    ),    api_key=require_env("OPENAI_API_KEY"),)def ask(client: OpenAI, model: str, question: str) -> str:    """    Minimal wrapper showing the common call pattern across all four gateways.    Model format varies by gateway:      CometAPI:   "gpt-5.4", "claude-opus-4-7", etc. (CometAPI identifiers)      Portkey:    "@openai/gpt-4o", "@anthropic/claude-3-5-sonnet", etc.      LiteLLM:    whatever model names you configured in your proxy      Cloudflare: standard OpenAI model names, e.g. "gpt-4o"    This function does not handle finish_reason, tool_calls, or provider errors.    For production error handling, see: How to Debug Failed AI API Generations.    """    response = client.chat.completions.create(        model=model,        messages=[{"role": "user", "content": question}],    )    return response.choices[0].message.content or ""

Node.js

import OpenAI from "openai";function requireEnv(name) {  const val = process.env[name];  if (!val) throw new Error(`Missing required environment variable: ${name}`);  return val;}// ── CometAPI ────────────────────────────────────────────────────────────────const cometClient = new OpenAI({  baseURL: "https://api.cometapi.com/v1",  apiKey: requireEnv("COMETAPI_KEY"),});// ── Portkey ─────────────────────────────────────────────────────────────────// Route to a provider by prefixing the model: "@openai/gpt-4o", "@anthropic/claude-3-5-sonnet"const portkeyClient = new OpenAI({  baseURL: "https://api.portkey.ai/v1",  apiKey: requireEnv("PORTKEY_API_KEY"),  defaultHeaders: {    "x-portkey-api-key": requireEnv("PORTKEY_API_KEY"),  },});// ── LiteLLM ──────────────────────────────────────────────────────────────────// Self-hosted. Default mode accepts any API key value.// Set LITELLM_BASE_URL if your server runs on a different host or port.const litellmClient = new OpenAI({  baseURL: process.env.LITELLM_BASE_URL ?? "http://localhost:4000",  apiKey: process.env.LITELLM_API_KEY ?? "anything",});// ── Cloudflare AI Gateway ───────────────────────────────────────────────────const cfClient = new OpenAI({  baseURL: `https://gateway.ai.cloudflare.com/v1/${requireEnv("CF_ACCOUNT_ID")}/${requireEnv("CF_GATEWAY_ID")}/openai`,  apiKey: requireEnv("OPENAI_API_KEY"),});/** * Minimal wrapper showing the common call pattern. * Model format varies by gateway — see Python example above for details. * Does not handle finish_reason or error recovery; add those for production use. */async function ask(client, model, question) {  const response = await client.chat.completions.create({    model,    messages: [{ role: "user", content: question }],  });  return response.choices[0].message.content ?? "";}

Het verbindingspatroon is hetzelfde voor alle vier. De betekenisvolle verschillen zitten elders: wat je kunt observeren, wat je kunt sturen en wat er gebeurt als er iets stukgaat.

Waar elk hulpmiddel daadwerkelijk goed in is

CometAPI

De kernpropositie van CometAPI is een gehoste catalogus met meer dan 500 modelendpoints, inclusief beeld- en videogeneratiemodellen naast tekstmodellen. Prijzen lopen via een groepsgebonden ratiosysteem — de standaardgroep past een 0.8x-multiplier toe op CometAPI’s basistarieven. Je kunt verschillende ratiogroepen configureren voor intern gebruik (0.1x) versus betalende klanten, wat het praktisch maakt om een getierd product te bouwen zonder aparte accounts te beheren.

Het dashboard biedt vier typen logs (standaard API-calls, beeldgeneratie, videogeneratie, Midjourney), een uptimeweergave van 30 dagen en kredietlimieten per sleutel. Kredietlimieten laten je API-sleutels aan klanten of contractors geven met een harde uitgavenplafond, wat een echt probleem oplost wanneer je toegang tot een gedeeld account verspreidt.

Wat CometAPI niet biedt: zelfhosting (enterprise-klanten kunnen een dedicated server aanvragen, maar dit is geen standaard zelfgehoste optie), rate limiting op gateway-niveau of SSO.

Beste keuze: Indie-ontwikkelaars en kleine teams die over veel modellen — inclusief beeld en video — willen routeren met één API-sleutel en één factureringsrelatie, en die budgetcontrole per sleutel nodig hebben.

Portkey

Portkey is een gehoste gateway die draait om observability. Je krijgt toegang tot 1,600+ LLMs via een unified API, met routing door de modelnaam te prefixen met de provider (@openai/gpt-4o, @anthropic/claude-3-5-sonnet). Dit betekent dat je geen aparte clientconfiguraties nodig hebt voor elke provider — één Portkey-client handelt ze allemaal af, en je wisselt de modelstring.

Naast routing biedt Portkey request tracing, promptversiebeheer en fallback-routing die je in het dashboard configureert in plaats van in code. De optie voor zelfhosting betekent dat je Portkey op je eigen infrastructuur kunt draaien als compliance dat vereist.

De GitHub-repository van Portkey’s open-source gateway wordt actief onderhouden — check de huidige sterrentelling rechtstreeks in plaats van op een hier genoemde waarde te vertrouwen, want die verandert vaak.

Beste keuze: Teams die audit trails nodig hebben, multi-provider-routing vanuit één clientconfiguratie, of API-sleutelblootstelling over ontwikkelaars willen beheren.

LiteLLM

LiteLLM is een Python-pakket en proxyserver, geen gehoste service. Je draait het zelf. Dit is een betekenisvol onderscheid: er is geen derde partij die je verzoeken afhandelt of je API-sleutels beheert. Providercredentials (je echte OpenAI-sleutel, Anthropic-sleutel, enz.) worden als server-side omgevingsvariabelen ingesteld; de client wijst gewoon naar de lokale proxy.

Standaard valideert LiteLLM de API-sleutel die cliënten sturen niet — elke waarde werkt. Als je virtuele sleutelbeheer inschakelt, geven cliënten virtuele sleutels door die LiteLLM valideert tegen zijn eigen database. In beide gevallen vertaalt de proxy OpenAI-formaatverzoeken naar het formaat dat de upstream-provider verwacht, zodat je applicatiecode niet verandert wanneer je een nieuwe provider toevoegt.

De afweging is operationele overhead: je bent verantwoordelijk voor het draaien, schalen en updaten van de server.

Beste keuze: Teams met devops-capaciteit, organisaties met compliancebeperkingen die derde-partij API-proxies verbieden, of iedereen die cross-provider-routing wil zonder verzoekinhoud aan een SaaS-leverancier toe te vertrouwen.

Cloudflare AI Gateway

Cloudflare AI Gateway is structureel anders dan de andere drie. Je verandert je API-sleutel niet of betaalt Cloudflare voor modeltoegang. In plaats daarvan vervang je de base-URL van de provider door een door Cloudflare beheerde URL die logging, caching en rate limiting aan de edge toevoegt.

Omdat Cloudflare tussen je applicatie en de provider zit, kan het identieke verzoeken cachen — nuttig als je applicatie dezelfde prompts herhaaldelijk verstuurt. Het gratis niveau dekt de meeste use-cases van indie-ontwikkelaars. De beperking is reikwijdte: Cloudflare aggregeert geen modellen over providers. Je hebt nog steeds aparte provideraccounts en sleutels nodig voor elke provider die je gebruikt.

Beste keuze: Ontwikkelaars die al op Cloudflare’s infrastructuur zitten, of iedereen die caching en logging bovenop bestaande provideraccounts wil zonder een nieuwe factureringsrelatie te introduceren of API-sleutels te wijzigen.

Scenario-matching

Scenario	Aanbevolen tool	Reden
Indie-app, 10+ modellen proberen met één API-sleutel	CometAPI	Brede catalogus, eenvoudige setup, kredietlimieten per sleutel
Beeld + video genereren in dezelfde integratie	CometAPI	Geünificeerd endpoint voor tekst-, beeld- en videomodellen
Team van 5, bijhouden wie welk model gebruikt	Portkey	Request tracing, teambeheer
Routeren naar 1,600+ LLMs met één clientconfig	Portkey	@provider/model-routing, geen per-provider setup
Fallback-routing over providers zonder codewijzigingen	Portkey	Declaratieve fallbackconfig in dashboard
Enterprise met vereisten voor dataresidency	LiteLLM (zelfgehost)	Geen third-party traffic handling
Budget is nul, comfortabel met zelfbeheer	LiteLLM	Open source, geen platformkosten
Al direct OpenAI gebruiken, caching gewenst	Cloudflare AI Gateway	Alleen URL-wissel, geen nieuwe factureringsrelatie
RBAC nodig voor meerdere teams	Portkey of LiteLLM	Beide hebben team/rolbeheer; CometAPI en Cloudflare niet

Wat deze vier niet dekken

Deze vergelijking behandelt de gateways die het vaakst voorkomen in discussies onder indie-ontwikkelaars. De markt omvat andere opties die het waard zijn om te kennen: Helicone richt zich op observability zonder als proxy op te treden, OpenRouter specialiseert in routing naar open-weight en researchmodellen, en AWS Bedrock is Amazons managed AI-service gericht op enterprise-workloads. Als je vereisten niet in een van de vier hierboven passen, zijn dat de volgende plekken om te kijken.

De overstap maken

Als je momenteel rechtstreeks een provider aanroept en een gateway overweegt, is de codewijziging klein. Voor CometAPI voeg je één omgevingsvariabele toe en wijzig je de base_url. Voor Portkey voeg je een header toe en verander je hoe je het model specificeert (@openai/gpt-4o in plaats van gpt-4o). Voor Cloudflare wijzig je de URL zonder je provider-API-sleutel aan te raken. Voor LiteLLM draai je eerst een lokale server, en wijs je je client ernaar.

De grotere vraag is niet hoe je de overstap maakt, maar of je dat nodig hebt. Als je één provider aanroept, geen problemen hebt met kosteninzicht en geen cross-model-routing nodig hebt, voegt een gateway complexiteit toe zonder voordeel. Als je meerdere providers aanroept, sleutels verspreidt naar contractors, of merkt dat onverwachte rekeningen een terugkerend probleem zijn, is de integratie-overhead de moeite waard.

FAQ

Kan ik deze gateways samen gebruiken?

Ja. Sommige teams draaien LiteLLM zelfgehost voor gevoelige workloads en CometAPI voor de rest. Cloudflare AI Gateway kan vóór CometAPI-verzoeken zitten als je Cloudflare’s cachinglaag erbovenop wilt — al voegt dit een netwerkhop toe.

Slaan deze gateways mijn prompts op?

Hangt af van de tool en je configuratie. Portkey en CometAPI loggen standaard verzoeken; beide hebben retentie-instellingen. LiteLLM slaat alleen op wat jij configureert, op je eigen infrastructuur. Cloudflare’s loggedrag staat beschreven in hun AI Gateway-documentatie. Lees de privacyvoorwaarden van elke gehoste dienst voordat je gevoelige inhoud erdoorheen stuurt.

Wat gebeurt er als de gateway uitvalt?

Voor gehoste gateways (CometAPI, Portkey, Cloudflare) betekent gatewaydowntime dat je applicatie de AI-provider via dat pad niet kan bereiken. LiteLLM lokaal draaien heeft dezelfde beschikbaarheidskenmerken als je eigen server. Controleer voordat je je committeert aan een gehoste gateway voor productiegebruik de SLA en of directe-provider fallback wordt aangeboden als de gateway zelf niet beschikbaar is.

Is er een gratis manier om elk te evalueren vóór commitment?

Ja. CometAPI en Portkey hebben beide gratis niveaus. LiteLLM is open source en kost alleen de infrastructuur die je erop draait. Cloudflare AI Gateway is gratis binnen royale limieten. Je kunt alle vier op dezelfde testprompts draaien voordat je een beslissing neemt.

Hoe kies ik de juiste modelnamen voor elke gateway?

Elke gateway heeft zijn eigen conventie. CometAPI gebruikt eigen identifiers (gpt-5.4, claude-opus-4-7). Portkey gebruikt het formaat @provider/model-name (@openai/gpt-4o, @anthropic/claude-3-5-sonnet). LiteLLM gebruikt de modelnamen die je in je proxyconfig definieert. Cloudflare geeft standaard providermodelnamen ongewijzigd door. Check de documentatie van elke gateway voor de huidige modellenlijst voordat je code schrijft.

Beïnvloedt het wisselen van gateway mijn bestaande rate limits?

Ja. Als je overstapt van directe OpenAI-calls naar een gateway die de providerrelatie beheert (zoals CometAPI), worden je effectieve rate limits bepaald door het account van de gateway bij OpenAI, niet door je persoonlijke account. Verifieer het rate-limitgedrag met de gateway voordat je productietraffic migreert.