Google lancia i modelli Imagen 4, Imagen 4 Ultra e Veo 3 al Google I/O 2025

CometAPI
AnnaMay 18, 2025
Google lancia i modelli Imagen 4, Imagen 4 Ultra e Veo 3 al Google I/O 2025

Google è pronta a svelare i suoi modelli di intelligenza artificiale generativa di prossima generazione:Immagine 4, Immagine 4 Ultrae Veo 3—durante la conferenza annuale degli sviluppatori Google I/O su 20 maggio 2025Prime perdite di identificatori di anteprima (ad esempio, imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) segnalano un'implementazione graduale e più livelli di capacità nei domini di sintesi di immagini e video. Imagen 4 mira a offrire miglioramenti significativi in ​​termini di fotorealismo, fedeltà dei prompt e coerenza stilistica rispetto a Imagen 3, mentre la variante "Ultra" potrebbe offrire una risoluzione ancora più elevata o modalità di prestazioni specializzate. Sul lato video, Veo 3 promette una continuità clip-to-clip più coerente e una solida aderenza stilistica rispetto a Veo 2. Si prevede che tutti e tre i modelli si integreranno strettamente con l'ecosistema di intelligenza artificiale Gemini di Google, consentendo transizioni fluide da prompt di testo a immagini o video all'interno dello stesso flusso di lavoro.


Identificatori di anteprima e strategia di lancio

Anteprime in fasi: riferimenti interni come

  • imagen-4.0-generate-preview-05-20
  • imagen-4.0-ultra-generate-exp-05-20
  • veo-3.0-generate-preview

Google lancia i modelli Imagen 4, Imagen 4 Ultra e Veo 3 al Google I/O 2025
Google lancia i modelli Imagen 4, Imagen 4 Ultra e Veo 3 al Google I/O 2025

Sono emersi nei repository di codice e nelle anteprime delle API, indicando l'intenzione di Google di offrire livelli di prestazioni sia standard che "Ultra" per la generazione di immagini, nonché un'anteprima avanzata del modello video per i primi tester.

Lancio di Google I/O:

Questi identificatori suggeriscono fortemente che Google presenterà e potenzialmente concederà l'accesso in anteprima agli sviluppatori all'I/O su 20 maggio 2025, rispecchiando i precedenti lanci di Imagen 3 e Veo 2.


Novità di Imagen 4

Fotorealismo e fedeltà

  • Rendering migliorato: Imagen 4, a quanto pare, offre un dettaglio fotorealistico maggiore, riducendo gli artefatti e migliorando la precisione dei colori. Le prime indiscrezioni suggeriscono miglioramenti nella comprensione di prompt complessi, come luci sfumate o riflessi.
  • Adesione immediata:Ci si aspetta che il modello segua le istruzioni dell'utente in modo più preciso, fornendo immagini che corrispondono meglio sia ai contenuti che alle direttive di stile (ad esempio, "dipinto a olio del tramonto sulle montagne").

Coerenza di stile

  • Coesione multi-immagine: Imagen 4 è progettato per mantenere uno stile visivo coerente su più output, il che è vantaggioso per casi d'uso come lo storyboard o la creazione di cataloghi di prodotti, in cui l'uniformità è fondamentale.
  • Variante Ultra: Il livello “Ultra” (imagen-4.0-ultra) offre probabilmente output a risoluzione più elevata o ottimizzazioni specializzate (ad esempio, fedeltà ultra elevata per supporti di stampa) per professionisti aziendali e creativi.

Novità di Veo 3

Coerenza migliorata

  • Continuità da clip a clip:Veo 3 mira a generare sequenze video in cui le riprese successive mantengono inquadrature, luci e aspetto dei personaggi coerenti, affrontando le limitazioni di Veo 2 relative alla deriva visiva nel tempo.
  • Fedeltà di stile:Il modello si concentra sulla replica più fedele di stili artistici o cinematografici, rendendo più semplice la produzione di video nell'estetica desiderata (ad esempio, noir, animazione pastello).

Integrazione della filigrana SynthID

  • Filigrana digitale: Sfruttando la tecnologia SynthID di DeepMind (introdotta con Veo 2), Veo 3 integrerà filigrane impercettibili per aiutare a identificare i contenuti generati dall'intelligenza artificiale e a limitarne l'uso improprio.

Integrazione con Gemini AI

  • Accesso senza soluzione di continuità: Si prevede che sia Imagen 4 che Veo 3 saranno direttamente accessibili tramite le interfacce Gemini di Google, consentendo agli utenti di generare immagini o video all'interno di prompt basati su chat o tramite interfacce di prodotto come Google Foto e Google Presentazioni.
  • Gemelli Gemelli: Le “Gemme” di intelligenza artificiale personalizzate possono incorporare questi modelli, consentendo agli utenti di creare assistenti specializzati (ad esempio, una Gem per la pianificazione dei viaggi che genera immagini di itinerari e video di panoramica) e condividerli in un mercato simile al GPT Store di ChatGPT.

Disponibilità e prossimi passi

pubblico Anteprima: Gli sviluppatori e i tester aziendali potrebbero ricevere inviti a sperimentare Imagen 4 (standard e Ultra) e Veo 3 a partire da 20 maggio 2025 al Google I/O, con un'implementazione più ampia nei Labs e in Vertex AI nelle settimane successive.

Feedback e iterazione:Come per i lanci precedenti, è probabile che Google solleciti il ​​feedback degli utenti per perfezionare i filtri di sicurezza, la robustezza della filigrana e le ottimizzazioni delle prestazioni prima della disponibilità generale.

Guarda questo spazio: gli sviluppatori interessati dovrebbero monitorare il CometaAPI.

Il nuovo modello API sarà disponibile su CometAPI e si promette di offrire prezzi inferiori a quelli di Google per facilitarne l'integrazione. Continuate a seguirci. Documento API.

Leggi di più

500+ Modelli in Una API

Fino al 20% di sconto