Promptfoo is een open-source CLI-tool voor het testen, evalueren en red-teamen van LLM-prompts, -modellen en -applicaties. In combinatie met CometAPI—een uniforme, OpenAI-compatibele API voor 500+ modellen—kunnen ontwikkelaars met één sleutel testen op GPT, Claude, Gemini, Grok, DeepSeek en meer, vaak 20-40% goedkoper dan rechtstreeks bij providers. Deze gids behandelt setup, configuraties, geavanceerd gebruik en aantoonbare voordelen met echte data.
Voor featured snippet geoptimaliseerde samenvatting
Promptfoo is een open-source CLI-tool voor het testen, evalueren en red-teamen van LLM-prompts, -modellen en -applicaties. In combinatie met CometAPI—een uniforme, OpenAI-compatibele API voor 500+ modellen—kunnen ontwikkelaars met één sleutel testen op GPT, Claude, Gemini, Grok, DeepSeek en meer, vaak 20-40% goedkoper dan rechtstreeks bij providers. Deze gids behandelt setup, configuraties, geavanceerd gebruik en aantoonbare voordelen met echte data.
Wat is Promptfoo?
Promptfoo is een bewezen, open-source CLI en bibliotheek voor testgedreven LLM-ontwikkeling. In plaats van handmatige trial-and-error automatiseert het evaluaties over prompts, modellen, RAG-systemen en agenten. Belangrijke mogelijkheden:
- Modelvergelijkingen naast elkaar met matrixweergaven.
- Geautomatiseerde asserties (exacte overeenkomst, regex, LLM-als-jury, semantische gelijkenis, enz.).
- Red teaming voor kwetsbaarheden zoals prompt injection, jailbreaks en merkrisico’s (50+ plugintypes).
- CI/CD-integratie, caching, gelijktijdigheid en live herladen.
- Ondersteuning voor 60+ providers, aangepaste scripts en HTTP-eindpunten.
Adoptie-statistieken (2026): Gebruikt door 156 Fortune 500-bedrijven, drijft apps aan die miljoenen gebruikers bedienen, en vertrouwd door teams bij Shopify en meer. Het is MIT-gelicentieerd met sterke community-momentum.
Promptfoo vervangt “het werkt op mijn machine” door herhaalbare, kwantificeerbare benchmarks—cruciaal nu LLM-apps naar productie gaan.
Waarom CometAPI gebruiken met Promptfoo?
CometAPI is een ontwikkelaarsgerichte, uniforme API die 500+ geavanceerde modellen (LLM’s, image, video, embeddings) bundelt van OpenAI, Anthropic, Google, xAI, DeepSeek en anderen. Het is volledig OpenAI-compatibel, dus bestaande code werkt met een simpele wijziging van base_url.
Belangrijkste voordelen van de combinatie:
- Enorme modeldiversiteit zonder sleutelbeheer: Test GPT-5-varianten, Claude Opus 4.x, Gemini 3.x, Grok 4, DeepSeek V4, Flux, DALL-E, Sora-achtige modellen, enz., met één sleutel. Geen gedoe met meerdere accounts.
- Aanzienlijke kostenbesparing: CometAPI prijst modellen minstens 20-40% onder de officiële tarieven met pay-as-you-go (geen abonnementen). Rapporten van echte gebruikers en benchmarks tonen consistente besparingen versus direct of concurrenten zoals OpenRouter.
- Native Promptfoo-ondersteuning: Toegewijde
cometapi:-provider met chat-, completion-, embedding- en image-types. Naadloos voor evaluaties en red teaming. - Betrouwbaarheid en snelheid: 99,9% uptime, <400 ms gemiddelde latentie, enterprise-privacy (geen training op prompts), gebruiksdashboards en failover-routing.
- Flexibiliteit voor evaluatieworkflows: Voer goedkope A/B-tests uit op toonaangevende modellen, benchmark RAG-nauwkeurigheid of red-team agenten over providers heen zonder het budget te breken.
Bij grootschalig testen kan overschakelen naar CometAPI via Promptfoo de evaluatiekosten drastisch verlagen en tegelijk de dekking verbreden. Bijvoorbeeld, het parallel testen van meerdere Claude/GPT-equivalenten wordt triviaal en betaalbaar. Teams melden vanaf dag één 20%+ besparing, met volledige portabiliteit (geen lock-in).
Laatste context (2026): Met snelle modelreleases (bijv. Claude Opus 4-8, GPT-5-serie, Gemini-vooruitgang) zijn uniforme platforms zoals CometAPI + evaluatietools zoals Promptfoo essentieel om wendbaar te blijven zonder budgetten te laten exploderen. Het ecosysteem van Promptfoo breidt de providerondersteuning verder uit, inclusief diepere CometAPI-integratie.
Vereisten
- Node.js (v18+ aanbevolen): Promptfoo is primair Node-gebaseerd.
- CometAPI-account en -sleutel: Meld je gratis aan bij CometAPI voor testtegoeden. Haal de sleutel op via console/token.
- Promptfoo geïnstalleerd:
npm install -g promptfoo
# Of npx promptfoo@latest voor eenmalig gebruik
- Basiskennis van YAML en de terminal.
- (Optioneel) Python voor aangepaste providers, of Docker voor isolatie.
Verifieer de installatie: promptfoo --version.
Hoe de Promptfoo-integratie met CometAPI configureren
1. Stel je CometAPI API-sleutel in
export COMETAPI_KEY=your_actual_key_here
# Blijvend maken met .env of shell-profiel
Promptfoo leest dit automatisch voor de provider cometapi.
Stel COMETAPI_KEY in voordat je evaluaties uitvoert:
read -rsp "CometAPI API key: " COMETAPI_KEY
printf '\n'
export COMETAPI_KEY
2. Kies het CometAPI-providerformaat
In promptfooconfig.yaml:
providers:
- cometapi:chat:gpt-5-mini # Defaults to chat
- cometapi:chat:claude-3-5-sonnet-20241022
- cometapi:image:flux-schnell # Image gen
- cometapi:embedding:text-embedding-3-small
# Or shorthand
- cometapi:gpt-5.4-pro
Volledige syntax: cometapi:<type>:<model>. Type is standaard chat. Ondersteunt alle OpenAI-parameters via config.
Gebruik deze providertypen:
| Type | Use-case |
|---|---|
| chat | Chatcompletions, vision en multimodale prompts |
| completion | Tekstcompletion-modellen |
| embedding | Tekst-embedding-evaluaties |
| image | Beeldevaluaties/generatie |
Je kunt ook cometapi:your-model-id gebruiken voor de standaard chatmodus.
3. Voer een snelle CLI-evaluatie uit
# Eenvoudige eenmalige run
npx promptfoo@latest eval --prompts "Write a haiku about AI" -r cometapi:chat:your-model-id
# Met volledige configuratie
promptfoo eval
Dit genereert een webviewer met scores, uitvoer en diffs.
4. Maak een uitgebreide Promptfoo-configuratiefile
Het volgende promptfooconfig.yaml evalueert dezelfde prompt tegen een CometAPI-model:
prompts:
- "Classify this support request: {{message}}"
providers:
- id: cometapi:chat:your-model-id
config:
temperature: 0.2
max_tokens: 256
tests:
- vars:
message: "The API key works locally but fails in production."
assert:
- type: contains-any
value:
- authentication
- configuration
Voer het configuratiebestand uit met Promptfoo:
npx promptfoo@latest eval -c promptfooconfig.yaml
Voer promptfoo redteam setup uit voor geautomatiseerde kwetsbaarheidsscans.
Gedetailleerde stapsgewijze workflow voor robuuste evaluaties
- Definieer bedrijfskritische scenario’s: Maak testsuites die echt gebruik nabootsen (bijv. klantenondersteuning, codegeneratie, creatieve taken).
- Prompt engineering-iteratie: Gebruik variabelen (
{{var}}) en bestandsgebaseerde prompts. Volg versies. - Modelvergelijkingsmatrix: Voer evaluaties uit over 5-10 modellen. Analyseer kosten, latentie, kwaliteitsscores.
- Scoring en asserties: Combineer regelgebaseerde, modelgebaseerde (LLM-judge) en aangepaste JS/Python-beoordeelaars.
- CI/CD-integratie: Voeg toe aan GitHub Actions:
- name: Promptfoo Eval
run: promptfoo eval --ci
- Monitoren en itereren: Gebruik de viewer van Promptfoo + het CometAPI-dashboard voor inzicht in uitgaven/latentie.
Voorbeeldanalyse van output: Verwacht tabellen met winpercentages, bijv. Claude beter op redeneren, GPT op snelheid, DeepSeek op kosten voor bepaalde taken.
CometAPI vs. directe providers vs. alternatieven in Promptfoo
| Aspect | CometAPI + Promptfoo | Direct (OpenAI/Anthropic) | Andere aggregators (bijv. OpenRouter) |
|---|---|---|---|
| Beschikbare modellen | 500+ verenigd | Beperkt per leverancier | Veel, maar variabel |
| Prijzen | 20-40% onder officieel | Vol tarief | Officieel + toeslagen |
| Sleutelbeheer | Enkele sleutel | Meerdere | Meerdere |
| Latentie/Uptime | <400 ms, 99,9% | Variabel | Variabel |
| Promptfoo native | Ja, volledige ondersteuning | Ja | Gedeeltelijk |
| Privacy | Geen training op prompts | Providerbeleid | Variabel |
| Beste voor | Brede tests & productie | Vendor lock-in bij één leverancier | Eenvoudige routing |
Datainzicht: Voor 1M tokens gebruik van een mid-tier model bespaart CometAPI vaak $5-20+ per miljoen t.o.v. direct, wat zich opstapelt in evaluatielussen (honderden/duizenden calls).
Veelvoorkomende problemen oplossen
- API-sleutelfouten: Controleer de omgevingsvariabele
COMETAPI_KEY(echo $COMETAPI_KEY). Kijk in de console of je tegoed hebt. - Model niet gevonden: Lijst modellen via
curl -H "Authorization: Bearer $COMETAPI_KEY"https://api.cometapi.com/v1/models. Gebruik exacte namen. - Snelheidslimieten: CometAPI handelt upstream slim af; stel
delayin de config in of verlaag gelijktijdigheid. - Hoge latentie in evaluaties: Schakel caching in (
cache: true). Gebruik kleinere modellen voor eerste tests. - Assertie-fouten: Stel rubrieken bij of gebruik meer voorbeelden. LLM-jury’s kunnen inconsistent zijn—gemiddeld over meerdere runs (
repeat: 3). - Image/vision-problemen: Zorg dat het model de modaliteit ondersteunt; geef geldige URL’s.
- YAML-parsing: Valideer met de Promptfoo-schema’s of online tools.
- Machtigingen/CORS: Controleer headers voor aangepaste HTTP.
Pro tip: Voer promptfoo eval --verbose uit voor gedetailleerde logs. Controleer de status/het dashboard van CometAPI op storingen.
Probleemoplossing
Promptfoo kan de API-sleutel niet vinden
Bevestig dat COMETAPI_KEY is geëxporteerd in dezelfde shell-sessie waarin je promptfoo eval uitvoert.
Het providertype komt niet overeen met het model
Gebruik chat voor conversationele en multimodale modellen, embedding voor embedding-modellen en image voor afbeeldingsgeneratie-modellen.
De model-ID faalt
Vervang your-model-id door een exacte model-ID van de CometAPI Models-pagina.
Geavanceerde tips en best practices
- Kostenoptimalisatie: Begin met goedkope modellen (bijv. GPT-5-mini of DeepSeek via CometAPI) voor promptiteratie, valideer daarna met premium.
- Aangepaste providers: Breid uit met JS/Python indien nodig buiten CometAPI.
- RAG & agent-testing: Integreer retrieval-variabelen en tool-calls.
- Beveiliging: Voer grondige red teaming uit vóór productie. Promptfoo + de privacyfocus van CometAPI helpt.
- Schaalbaarheid: Gebruik cloudrunners of host Promptfoo zelf voor grote suites.
- Monitoring: Combineer met CometAPI-analyses voor tokenuitgaven per model.
Aanbevelingen van CometAPI voor je stack (van Cometapi.com):
- Gebruik voor alle evaluatieworkloads om kosten te minimaliseren.
- Maak gebruik van de playground voor snelle tests.
- Monitor gebruiksalerts om binnen budget te blijven.
- Verken image/video-modellen voor multimodale evaluaties in Promptfoo.
Conclusie: Til je LLM-ontwikkeling vandaag naar een hoger niveau
Het integreren van CometAPI met Promptfoo levert een krachtige, voordelige en schaalbare oplossing voor moderne AI-ontwikkeling. Je krijgt ongeëvenaarde modelflexibiliteit, rigoureuze tests, kostenvoordelen en gemoedsrust via geautomatiseerde red teaming—met volledige controle.
Begin klein: stel de sleutel in, voer het voorbeeldconfiguratiebestand uit en breid je testsuite uit. De tijd en het geld die je bespaart zullen zich opstapelen naarmate je AI-applicaties groeien.
Klaar om te implementeren? Ga naar CometAPI voor je gratis sleutel en duik in de Promptfoo-documentatie. Voor maatwerkadvies of geavanceerde setups op Cometapi.com, bekijk onze resources.
