modelli
Ingresso:$4/M
Uscita:$24/M
GPT Image 2 è il modello di generazione di immagini all’avanguardia di OpenAI per generare e modificare immagini in modo rapido e di alta qualità. Supporta dimensioni di immagine flessibili e input di immagini ad alta fedeltà.Al Secondo:$0.063
Seedance 2.0 è il modello multimodale di base per il video di nuova generazione di ByteDance, incentrato sulla generazione di video narrativi cinematografici a più inquadrature. A differenza delle demo da testo a video a singola inquadratura, Seedance 2.0 enfatizza il controllo basato su riferimenti (immagini, clip brevi, audio), la coerenza di personaggi/stile tra le inquadrature e la sincronizzazione audio/video nativa — con l’obiettivo di rendere i video generati dall’IA utili per i flussi di lavoro creativi professionali e di previsualizzazione.Ingresso:$4/M
Uscita:$20/M
Modello più intelligente per agenti e programmazioneIngresso:$2.4/M
Uscita:$12/M
Claude Sonnet 4.6 è il nostro modello Sonnet più capace finora. È un aggiornamento completo delle capacità del modello in ambiti quali programmazione, uso del computer, ragionamento su contesti estesi, pianificazione degli agenti, lavoro basato sulla conoscenza e design. Sonnet 4.6 offre anche una finestra di contesto da 1M token in beta.Eccelle nel ragionamento agentico, nel lavoro intellettuale e nell'uso di strumenti. Ingresso:$24/M
Uscita:$144/M
Un modello avanzato, ingegnerizzato per logiche estremamente complesse e esigenze professionali, che rappresenta il più alto standard di ragionamento profondo e capacità analitiche precise.Ingresso:$4/M
Uscita:$24/M
Un modello multimodale di punta di nuova generazione, che bilancia prestazioni eccezionali ed efficienza di risposta, dedicato a fornire servizi di IA di uso generale completi e stabili.Per Richiesta:$0.04
GPT Image 2 è il modello di generazione di immagini all'avanguardia di OpenAI per generare e modificare immagini in modo rapido e con alta qualità. Supporta dimensioni dell'immagine flessibili e input di immagini ad alta fedeltà.Ingresso:$0.416/M
Uscita:$0.832/M
DeepSeek V4 Pro è un modello Mixture-of-Experts su larga scala di DeepSeek, con 1.6T parametri totali e 49B parametri attivati, e supporto a una finestra di contesto da 1M token. È progettato per il ragionamento avanzato, la programmazione e i flussi di lavoro di agenti a lungo orizzonte, con prestazioni elevate in benchmark di conoscenza, matematica e ingegneria del software.Ingresso:$0.12/M
Uscita:$0.24/M
DeepSeek V4 Flash è un modello Mixture-of-Experts ottimizzato per l'efficienza di DeepSeek con 284B di parametri totali e 13B di parametri attivati, che supporta una finestra di contesto da 1M-token. È progettato per un'inferenza rapida e carichi di lavoro ad alto throughput, mantenendo al contempo solide prestazioni di ragionamento e di programmazione.Ingresso:$0.24/M
Uscita:$0.96/M
MiniMax-M2.7 offre la stessa intelligenza di altissimo livello della versione standard, inclusa l’autoevoluzione ricorsiva e una produttività d’ufficio di livello esperto, ma è progettato per applicazioni che richiedono una latenza inferiore al secondo e una generazione di token ad alta velocità. Sfruttando un’architettura backbone di inferenza migliorata, la sua velocità di output è del 66% più rapida rispetto al modello standard (raggiungendo 100 tps). È la scelta ideale per assistenti di programmazione interattivi, esecuzione in tempo reale di cicli di agenti e pipeline aziendali ad alto throughput con rigorosi requisiti sui tempi di completamento.Contesto:400,000
Ingresso:$0.16/M
Uscita:$1/M
GPT-5.4 nano è progettato per attività in cui la velocità e il costo contano maggiormente, come classificazione, estrazione dei dati, ordinamento e sub-agenti.Contesto:400,000
Ingresso:$0.6/M
Uscita:$3.6/M
GPT-5.4 mini porta i punti di forza di GPT-5.4 in un modello più veloce ed efficiente, progettato per carichi di lavoro ad alto volume.Contesto:1,050,000
Ingresso:$24/M
Uscita:$144/M
Versione di GPT-5.4 che fornisce risposte più intelligenti e più precise.Ingresso:$0.4/M
Uscita:$2.4/M
Panoramica delle capacità principali: Risoluzione: Fino a 4K (4096×4096), alla pari con Pro. Coerenza delle immagini di riferimento: Fino a 14 immagini di riferimento (10 oggetti + 4 personaggi), mantenendo la coerenza di stile e dei personaggi. Rapporti d'aspetto estremi: Aggiunti i nuovi rapporti 1:4, 4:1, 1:8, 8:1, adatti a immagini lunghe, poster e banner. Rendering del testo: Generazione di testo avanzata, adatta per infografiche e layout per poster di marketing. Miglioramento della ricerca: Integrazione di Ricerca Google + Ricerca immagini. Grounding: Processo di ragionamento integrato; i prompt complessi vengono analizzati prima della generazione.Ingresso:$60/M
Uscita:$240/M
MiMo-V2.5-Pro è il modello di punta di Xiaomi, eccellendo nelle capacità da agente generalista e nella complessa ingegneria del software.Ingresso:$60/M
Uscita:$240/M
MiMo-V2.5 è il modello nativo completamente multimodale di Xiaomi. Offre prestazioni da agente di livello professionale a circa la metà del costo di inferenza, superando al contempo MiMo-V2-Omni nella percezione multimodale nei compiti di comprensione di immagini e video.Ingresso:$2.4/M
Uscita:$14.4/M
GPT-5.5 eccelle nella scrittura di codice, nella ricerca online, nell'analisi dei dati e nelle operazioni tra strumenti. Il modello non solo migliora la propria autonomia nella gestione di attività complesse a più fasi, ma migliora anche in modo significativo le capacità di ragionamento e l'efficienza di esecuzione, mantenendo la stessa latenza del suo predecessore, segnando un importante passo verso l'automazione dei processi d'ufficio nell'IA.Contesto:2,000,000
La versione 4.20 di Grok introduce un'architettura multi-agente (più agenti specializzati coordinati in tempo reale), modalità di contesto estese e miglioramenti mirati alla capacità di seguire le istruzioni, alla riduzione delle allucinazioni e agli output strutturati/strumentati.Ingresso:$0.32/M
Uscita:$1.92/M
Qwen 3.6-Plus è ora disponibile, con capacità potenziate per lo sviluppo del codice e una maggiore efficienza nel riconoscimento e nell’inferenza multimodali, rendendo l’esperienza Vibe Coding ancora migliore.Ingresso:$0.76/M
Uscita:$3.19998/M
Kimi K2.6 è il modello più recente e più intelligente di Kimi, dotato di capacità di scrittura di codice a lungo termine più robuste e più stabili, con una conformità alle istruzioni e capacità di autocorrezione notevolmente migliorate, e supporta input di testo, immagini e video, modalità di ragionamento e di non ragionamento, e compiti di dialogo e di agente.Ingresso:$0.8/M
Uscita:$3.2/M
GLM-5.1 (rilasciato ad aprile 2026), progettato ad hoc pentru compiti autonomi con orizzonte temporale lungo. A differenza dei modelli tradizionali ottimizzati per interazioni brevi, GLM-5.1 eccelle nel mantenere l’allineamento agli obiettivi, nel ridurre la deriva strategica e nel fornire risultati pronti per la produzione per periodi prolungati — fino a 8 ore di lavoro autonomo continuo su un singolo compito complesso. Rappresenta un grande salto nell’ingegneria agentica, spostando la valutazione dall’intelligenza a singolo turno all’esecuzione sostenuta nel mondo reale.Ingresso:$60/M
Uscita:$240/M
Claude Mythos Preview è il nostro modello di frontiera più capace finora e mostra un
balzo notevole nei punteggi su molti benchmark di valutazione rispetto al nostro precedente modello di frontiera, Claude Opus 4.6.Ingresso:$0.8/M
Uscita:$2.4/M
MiMo-V2-Pro è il modello di base di punta di Xiaomi, con oltre 1T di parametri totali e una lunghezza del contesto di 1M, profondamente ottimizzato per scenari agentici. È altamente adattabile a framework per agenti generici come OpenClaw. Si colloca tra i migliori al mondo nei benchmark standard PinchBench e ClawBench, con prestazioni percepite che si avvicinano a quelle di Opus 4.6. MiMo-V2-Pro è progettato per fungere da cervello dei sistemi di agenti, orchestrando flussi di lavoro complessi, guidando attività di ingegneria in produzione e fornendo risultati in modo affidabile.Ingresso:$0.32/M
Uscita:$1.6/M
MiMo-V2-Omni è un modello omnimodale all'avanguardia che elabora nativamente input di immagini, video e audio all'interno di un'architettura unificata. Combina una solida percezione multimodale con capacità agentiche - grounding visivo, pianificazione a più fasi, uso di strumenti ed esecuzione di codice - risultando particolarmente adatto a compiti complessi del mondo reale che coinvolgono più modalità. Finestra di contesto da 256K.Contesto:200k
Ingresso:$0.96/M
Uscita:$3.264/M
GLM-5 Turbo è un nuovo modello di Z.ai progettato per un'inferenza rapida e prestazioni elevate in ambienti basati su agenti, come gli scenari OpenClaw.Contesto:1,050,000
Ingresso:$2/M
Uscita:$12/M
GPT-5.4 è il modello all'avanguardia per attività professionali complesse. Reasoning.effort supporta: none (predefinito), low, medium, high e xhigh.Ingresso:$1.4/M
Uscita:$11.2/M
Modello GPT-5.3 Instant utilizzato in ChatGPTIngresso:$0.2/M
Uscita:$1.2/M
Gemini 3.1 Flash-Lite è un modello Tier-3 altamente efficiente in termini di costi e a bassa latenza della serie Gemini 3 di Google, progettato per flussi di lavoro di IA di produzione ad alto volume, in cui throughput e velocità contano più della massima profondità di ragionamento. Combina un'ampia finestra di contesto multimodale con prestazioni di inferenza efficienti, a un costo inferiore rispetto alla maggior parte dei modelli di punta.Ingresso:$4/M
Uscita:$20/M
Claude Opus 4.6 è il modello linguistico di grandi dimensioni di classe “Opus” di Anthropic, rilasciato nel febbraio 2026. È posizionato come un cavallo di battaglia per il lavoro della conoscenza e i flussi di lavoro di ricerca — migliorando il ragionamento con contesti estesi, la pianificazione in più fasi, l’uso di strumenti (inclusi i flussi di lavoro software basati su agenti) e le attività d’uso del computer, come la generazione automatizzata di diapositive e fogli di calcolo.