SAN FRANCISCO, 25 luglio 2025 — Secondo quanto riferito, OpenAI si sta preparando a lanciare Sora 2, la versione di nuova generazione del suo modello text-to-video, che punta a superare concorrenti come Veo 3 di Google. Le voci sull'aggiornamento sono emerse in seguito all'analisi dei file pubblici di OpenAI e dei riferimenti al server "Sora 2", sebbene l'azienda non abbia ancora rilasciato un annuncio ufficiale.
Miglioramenti previsti di Sora 2
Audio e voce integrati
Una delle funzionalità principali previste per Sora 2 è l'audio generato dall'IA – voci fuori campo, rumori ambientali ed effetti sonori – che si allinea perfettamente con l'azione sullo schermo. Le prime indiscrezioni suggeriscono che OpenAI miri a insegnare a Sora 2 a "parlare" nei video, offrendo un'intonazione realistica, un'atmosfera ambientale e una sincronizzazione labiale precisa per evitare il limite del "film muto" del suo predecessore.
Miglioramento del movimento umano
Gli output attuali di Sora a volte mostrano figure umane deformate o "sciolte" a causa di limitazioni nella modellazione fisica e del movimento. Si prevede che Sora 2 sfrutterà tecniche di addestramento avanzate per simulare meglio il movimento umano realistico, riducendo le distorsioni negli arti e nel posizionamento del corpo e producendo azioni più naturali e fluide.
Clip più lunghe e di qualità superiore
Mentre i concorrenti in genere limitano i video a meno di dieci secondi, OpenAI ha dimostrato la capacità di Sora di gestire clip di 20 secondi o più. Sora 2 potrebbe estendere ulteriormente questi limiti, potenzialmente raggiungendo i 30 secondi o più, con miglioramenti incrementali in termini di risoluzione e fedeltà visiva. Queste funzionalità saranno probabilmente offerte a livelli, ovvero in piani di abbonamento più elevati, a causa delle loro notevoli esigenze di elaborazione.

Strategia di integrazione e prezzo
OpenAI potrebbe far coincidere il rilascio di Sora 2 con l'imminente lancio di GPT-5, sfruttando le sinergie tra modelli video e linguistici avanzati. Gli osservatori del settore sottolineano che l'integrazione di Sora 2 nell'ecosistema di ChatGPT potrebbe offrire prezzi competitivi rispetto all'accesso in abbonamento di Google a Veo 3, risultando interessante sia per i creatori di contenuti che per gli utenti aziendali. Tuttavia, la strategia di prezzo rimane incerta, con OpenAI che valuta la possibilità di un utilizzo più ampio rispetto ai costi infrastrutturali.
Panorama competitivo
OpenAI affronta una dura concorrenza da parte di Google Veo 3, che vanta già audio integrato e sincronizzazione labiale ottimizzata, e da piattaforme specializzate come kling, Pista di decolloe valle della luna, ognuno dei quali sta facendo rapidi progressi nel realismo video e nelle funzionalità. Quindi Sora 2 dovrà differenziarsi non solo per qualità e funzionalità, ma anche per accessibilità, potenzialmente attraverso prezzi vantaggiosi e l'integrazione con l'ecosistema più ampio di ChatGPT.
Guardando al futuro, il successo di Sora 2 dipenderà dalla sua capacità di offrire una generazione video fluida, etica ed economica. Poiché la tecnologia video generativa è sottoposta a un'analisi critica per potenziali abusi, si prevede che OpenAI implementerà misure di sicurezza simili a quelle utilizzate nel lancio iniziale di Sora, inclusi filtri per i contenuti e policy di utilizzo progettate per prevenire output dannosi o ingannevoli. Con l'intensificarsi della concorrenza, Sora 2 rappresenta un test cruciale per la leadership di OpenAI nel settore dei media basati sull'intelligenza artificiale.
Iniziamo
CometAPI è una piattaforma API unificata che aggrega oltre 500 modelli di intelligenza artificiale (IA) di provider leader, come la serie GPT di OpenAI, Gemini di Google, Claude di Anthropic, Midjourney, Suno e altri, in un'unica interfaccia intuitiva per gli sviluppatori. Offrendo autenticazione, formattazione delle richieste e gestione delle risposte coerenti, CometAPI semplifica notevolmente l'integrazione delle funzionalità di IA nelle tue applicazioni. Che tu stia sviluppando chatbot, generatori di immagini, compositori musicali o pipeline di analisi basate sui dati, CometAPI ti consente di iterare più velocemente, controllare i costi e rimanere indipendente dal fornitore, il tutto sfruttando le più recenti innovazioni nell'ecosistema dell'IA.
Gli sviluppatori possono accedere tramite CometaAPI, le ultime versioni dei modelli elencate sono quelle aggiornate alla data di pubblicazione dell'articolo. Per iniziare, esplora le capacità del modello in Parco giochi e consultare il Guida API per istruzioni dettagliate. Prima di accedere, assicurati di aver effettuato l'accesso a CometAPI e di aver ottenuto la chiave API. CometaAPI offrire un prezzo molto più basso rispetto al prezzo ufficiale per aiutarti a integrarti.
