| Cobertura de Modelos | 500+ (amplios LLMs, multimodal: texto, imagen, vídeo, audio, música) | 300-500+ (fuerte enrutamiento de LLMs, 60+ proveedores) | ~200+ (enfoque en LLMs de código abierto + inferencia) | 196-300+ (multi-modelo) | 100+ proveedores (proxy) | 100+ (vía proxies) | Limitado a la familia OpenAI (GPT-5, serie o, visión, audio) | Variable (agregador emergente) | 600+ (enfocado en multimedia: imagen/vídeo) | 1.000-50.000+ (modelos Cog de la comunidad, fuerte en imagen/generación) | 600+ (modelos especializados y exclusivos) | Limitado a la familia Claude (Opus, Sonnet, Haiku) |
| Tipos de Modelos | Mayor variedad: LLMs + multimodal completo (generación imagen/vídeo/audio/música) | LLMs fuertes + algo de multimodal | Principalmente LLMs de texto + fine-tuning | Amplios LLMs + multimodal | Depende de los proveedores configurados | Depende del backend | Texto, visión, audio/tiempo real | LLMs multimodales | Generación de imagen/vídeo sólida, inferencia rápida | Generativos amplios (imagen, vídeo, modelos) | Inferencia especializada (texto/multimedia) | Texto + modelos Claude multimodales |
| Modelo de Precios | Pago por uso/tokens, competitivo (20-40% de ahorro declarado en muchos modelos), 1M tokens gratis | Pago por uso (casi passthrough + pequeña tarifa), créditos | Por token/serverless, competitivo para modelos abiertos | Pago por uso | Gratis (autoalojado) o cloud; uso en los backends | Centrado en observabilidad, uso en los proveedores | Tarifas oficiales de OpenAI (a menudo más altas para frontier) | Tarifas competitivas de agregador | Por uso (megapíxel/segundo de vídeo) | Por segundo de tiempo de GPU | Pago por uso, SLA alto | Tarifas oficiales de Anthropic |
| Compatibilidad con el SDK de OpenAI | Sí (URL base intercambiable) | Sí (excelente) | Sí (estilo OpenAI) | Sí | Sí (proxy sólido) | Sí | Nativo | Probable | Parcial/limitada | Parcial (específico del modelo) | Sí para los soportados | No (se prefiere el SDK de Anthropic) |
| Soporte Multimodal | Fuerte (texto + imagen/vídeo/audio/música unificados) | Bueno (LLM + algo de visión) | Moderado (centrado en texto + algo) | Bueno | Depende de los proveedores | Depende | Fuerte dentro de OpenAI (visión, audio en tiempo real) | Variable | Excelente para imagen/vídeo | Fuerte para medios generativos | Bueno para multimedia específica | Fuerte dentro de Claude (visión) |
| Ideal Para | Acceso unificado más amplio + ahorro de costes + apps multimodales | Experimentación rápida y enrutamiento multi-LLM | Alojamiento y fine-tuning de LLMs de código abierto | Acceso flexible multi-modelo | Control autoalojado y observabilidad | Logging, caché, monitorización en producción | Funciones/rendimiento oficiales de OpenAI | Necesidades unificadas emergentes | Inferencia multimedia rápida | Prototipado de modelos comunitarios/abiertos | Fiabilidad en producción y velocidad especializada | Razonamiento/seguridad de primera clase de Claude |