GPT-OSS potrebbe essere il futuro dell'implementazione dell'intelligenza artificiale locale?

OpenAI ha annunciato il rilascio di GPT-OSS, una famiglia di due modelli linguistici open-weight—gpt-oss-120b e al gpt-oss-20b—sotto la licenza permissiva Apache 2.0, che segna la sua prima importante offerta open-weight dai tempi di GPT-2. L'annuncio, pubblicato il 5 agosto 2025, sottolinea che questi modelli offrono prestazioni di ragionamento all'avanguardia a una frazione del costo associato alle alternative proprietarie e, soprattutto, possono essere implementati sia su infrastrutture locali che cloud.

Architettura tecnica

La serie GPT-OSS sfrutta un Mix di esperti (MoE) Architettura del trasformatore per bilanciare prestazioni ed efficienza.

gpt-oss-120b: 117 miliardi di parametri totali, attiva 5.1 miliardi di parametri per token, impiega 128 esperti (4 attivi per token) e si estende su 36 livelli.
gpt-oss-20b: 21 miliardi di parametri totali, attiva 3.6 miliardi di parametri per token, impiega 32 esperti (4 attivi per token) e si estende su 24 livelli.
Entrambi i modelli utilizzano modelli di attenzione alternati, densi e sparsi localmente, e attenzione multi-query raggruppata per un'inferenza efficiente in termini di memoria.

Valutazioni delle prestazioni e della sicurezza

OpenAI segnala che gpt-oss-120b eguaglia o supera le prestazioni del suo modello proprietario o4-mini in una varietà di benchmark interni, tra cui la codifica della concorrenza (Codeforces), la risoluzione dei problemi generali (MMLU e HLE) e le query relative alla salute (HealthBench). Nel frattempo, gpt-oss-20b supera il vecchio o3-mini nei compiti di matematica competitiva (AIME 2024 e 2025) e nei compiti di salute, nonostante le sue dimensioni più piccole.

Inoltre, esperti esterni hanno esaminato la metodologia di sicurezza, confermando che rispetta gli stessi rigorosi standard di sicurezza delle soluzioni closed-weight di OpenAI. Il Safety Advisory Group di OpenAI ha inoltre perfezionato gpt-oss-120b in modo da sondare le potenzialità ad alto rischio (biologiche, chimiche, informatiche), senza trovare prove che la versione open-weight apporti un significativo avanzamento di questi vettori di minaccia rispetto ai modelli open esistenti.

Accessibilità e distribuzione

Una pietra miliare fondamentale di GPT OSS è esecuzione locale:

gpt-oss-20b può essere eseguito su un laptop di fascia alta con una GPU moderna, consentendo applicazioni offline o in sede.
gpt-oss-120b è ottimizzato per funzionare su una singola GPU di livello aziendale, rendendolo accessibile alle organizzazioni di medie dimensioni senza enormi cluster di elaborazione.
Sovranità e privacy dei dati: Mantenendo tutte le inferenze in sede, GPT-OSS riduce al minimo i rischi normativi e di sicurezza, fondamentali per settori come finanza, sanità e pubblica amministrazione.
Integrazione senza problemi: Il supporto preconfigurato in Hugging Face Transformers (v4.55.0) e le guide di distribuzione containerizzate di Northflank rendono l'avvio di GPT-OSS semplice come l'esecuzione di un server locale.

"Con GPT OSS, diamo la possibilità a sviluppatori e organizzazioni di sfruttare l'intelligenza artificiale all'avanguardia come risorse completamente proprietarie e personalizzabili", ha affermato Sam Altman, CEO di OpenAI. "Questa versione segna una svolta nella democratizzazione dell'accesso a modelli linguistici avanzati, mantenendo al contempo i più elevati standard di sicurezza e prestazioni".

Rendendo open source questi potenti modelli, OpenAI mira a promuovere un ecosistema di innovazione più dinamico, incoraggiando ottimizzazioni personalizzate, nuovi plug-in e applicazioni creative che spingono l'intelligenza artificiale verso il futuro. Sviluppatori e aziende possono scaricare immediatamente i modelli dal repository GitHub di OpenAI e iniziare a sperimentare con inferenza locale, integrazioni personalizzate e valutazioni di sicurezza specializzate.

Iniziamo

CometAPI è una piattaforma API unificata che aggrega oltre 500 modelli di intelligenza artificiale (IA) di provider leader, come la serie GPT di OpenAI, Gemini di Google, Claude di Anthropic, Midjourney, Suno e altri, in un'unica interfaccia intuitiva per gli sviluppatori. Offrendo autenticazione, formattazione delle richieste e gestione delle risposte coerenti, CometAPI semplifica notevolmente l'integrazione delle funzionalità di IA nelle tue applicazioni. Che tu stia sviluppando chatbot, generatori di immagini, compositori musicali o pipeline di analisi basate sui dati, CometAPI ti consente di iterare più velocemente, controllare i costi e rimanere indipendente dal fornitore, il tutto sfruttando le più recenti innovazioni nell'ecosistema dell'IA.

Gli sviluppatori possono accedere GPT-OSS-20B e al GPT-OSS-120B attraverso CometaAPI, le ultime versioni dei modelli elencate sono quelle aggiornate alla data di pubblicazione dell'articolo. Per iniziare, esplora le capacità del modello in Parco giochi e consultare il Guida API per istruzioni dettagliate. Prima di accedere, assicurati di aver effettuato l'accesso a CometAPI e di aver ottenuto la chiave API. CometaAPI offrire un prezzo molto più basso rispetto al prezzo ufficiale per aiutarti a integrarti.

Architettura tecnica

Valutazioni delle prestazioni e della sicurezza

Accessibilità e distribuzione

Iniziamo

Leggi di più

500+ Modelli in Una API