Google өзінің келесі ұрпақ генеративті AI үлгілерін таныстыруға дайын.Сурет 4, Imagen 4 Ultra, және Veo 3— жыл сайынғы Google I/O әзірлеушілер конференциясында 20 мамыр 2025 ж. Алдын ала қарау идентификаторларының ерте ағып кетуі (мысалы, imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) кескін және бейне синтезі домендері бойынша кезеңді шығару және бірнеше мүмкіндік деңгейлері туралы сигнал береді. Imagen 4 Imagen 3-ке қарағанда фотореализмде, жылдам дәлдікте және стилистикалық консистенцияда айтарлықтай жетістіктерге жетуге бағытталған, ал "Ultra" нұсқасы одан да жоғары ажыратымдылық немесе арнайы өнімділік режимдерін ұсына алады. Бейне жағында Veo 3 Veo 2-мен салыстырғанда, клиптен клипке үзіліссіздігін және сенімді стильді ұстануды уәде етеді. Барлық үш модель Google-дың Gemini AI экожүйесімен тығыз біріктіріледі деп күтілуде, бұл бір жұмыс процесінде мәтіндік нұсқаулардан кескіндерге немесе бейнелерге үздіксіз ауысуға мүмкіндік береді.
Идентификаторларды және шығару стратегиясын алдын ала қарау
Кезеңді алдын ала қараулар: сияқты ішкі сілтемелер
imagen-4.0-generate-preview-05-20imagen-4.0-ultra-generate-exp-05-20veo-3.0-generate-preview


Код репозиторийлері мен API алдын ала қарауларында пайда болды, бұл Google-дың кескін жасау үшін стандартты және «Ультра» өнімділік деңгейлерін, сондай-ақ ерте тестерлер үшін кеңейтілген бейне үлгісін алдын ала қарауды ұсыну ниетін көрсетеді.
Google I/O іске қосу:
Бұл идентификаторлар Google-дың енгізу/шығару кезінде әзірлеушілерге көрсетуге және алдын ала қарау рұқсатын беретініне сенімді. 20 мамыр 2025 ж, Imagen 3 және Veo 2 үшін алдыңғы шығарылымдарды көрсету.
Imagen 4-те қандай жаңалықтар бар
Фотореализм және адалдық
- Жетілдірілген көрсету: Imagen 4 артефактілерді азайтып, түс дәлдігін жақсартып, фотореалистикалық мәліметтерге қол жеткізеді. Алғашқы қауесеттер нюансты жарықтандыру немесе шағылысу сияқты күрделі сұрауларды түсінуді жақсартуды ұсынады.
- Шұғыл ұстану: Модель мазмұн мен стиль директиваларына жақсырақ сәйкес келетін кескіндерді жеткізе отырып, пайдаланушы нұсқауларын дәлірек орындайды деп күтілуде (мысалы, «таулар үстіндегі күннің батуы туралы майлы бояу»).
Стиль сәйкестігі
- Көп кескінді біріктіру: Imagen 4 біркелкі болу маңызды болып табылатын сюжеттік тақта немесе өнім каталогын жасау сияқты пайдалану жағдайларына пайда әкеліп, бірнеше шығыстарда дәйекті визуалды стильді сақтауға арналған.
- Ультра нұсқа: «Ультра» деңгейі (imagen‑4.0‑ultra) кәсіпорын мен шығармашылық кәсіпқойлар үшін жоғары ажыратымдылықтағы нәтижелерді немесе арнайы оңтайландыруларды (мысалы, баспа құралдары үшін өте жоғары дәлдік) ұсынуы мүмкін.
Veo 3-тегі жаңалықтар
Жақсартылған когеренттілік
- Clip-to-Clip үздіксіздігі: Veo 3 бейне тізбегін құруды мақсат етеді, онда дәйекті түсірілімдер дәйекті кадрларды, жарықтандыруды және кейіпкерлердің сыртқы түрін сақтайды, бұл Veo 2-дегі уақыт бойынша визуалды ауытқуға қатысты шектеулерді қарастырады.
- Стиль адалдығы: Модель көркем немесе кинематографиялық стильдерді дәлірек қайталауға бағытталған, бұл бейнелерді қажетті эстетикада шығаруды жеңілдетеді (мысалы, нуар, пастел анимациясы).
SynthID Watermarking интеграциясы
- Сандық су белгілері: DeepMind компаниясының SynthID технологиясын (Veo 2-мен бірге енгізілген) пайдалана отырып, Veo 3 AI жасаған мазмұнды анықтауға және дұрыс емес пайдалануды болдырмауға көмектесу үшін көрінбейтін су белгілерін енгізеді.
Gemini AI-мен интеграция
- Үздіксіз қол жеткізу: Imagen 4 және Veo 3 екеуіне де Google Gemini интерфейстері арқылы тікелей қол жеткізуге болады деп күтілуде, бұл пайдаланушыларға чатқа негізделген кеңестер немесе Google Photos және Google Slides сияқты өнім интерфейстері арқылы кескіндер мен бейнелерді жасауға мүмкіндік береді.
- Егіздердің асыл тастары: Пайдаланушыларға арнайы көмекшілерді (мысалы, маршрут кескіндері мен шолу бейнелерін жасайтын саяхатты жоспарлауға арналған Gem) жасауға және оларды ChatGPT GPT дүкеніне ұқсас нарықта бөлісуге мүмкіндік беретін теңшелген AI «Gems» осы үлгілерді қамтуы мүмкін.
Қол жетімділік және келесі қадамдар
Қоғамдық алдын ала қарау: Әзірлеушілер мен кәсіпорын тестерлері Imagen 4 (стандартты және Ultra) және Veo 3 басталатын тәжірибеге шақырулар алуы мүмкін. 20 мамыр 2025 ж Google I/O-да, келесі апталарда Labs және Vertex AI кеңірек шығарылады.
Кері байланыс және қайталау: Алдыңғы шығарылымдардағы сияқты, Google жалпы қолжетімділікке дейін қауіпсіздік сүзгілерін, су таңбасының беріктігін және өнімділікті оңтайландыруды нақтылау үшін пайдаланушыдан пікір сұрауы мүмкін.
Бұл кеңістікті қараңыз: мүдделі әзірлеушілер бақылауы керек CometAPI.
API жаңа үлгісі CometAPI тізімінде көрсетіледі және интеграцияны жеңілдету үшін Google-дан төмен бағаларды қамтамасыз етуге уәде етілген. Назар аударыңыз API құжаты.
