Veo 3 API — Google Vertex AI жүйесіндегі RESTful соңғы нүкте, ол әзірлеушілерге бір сұрауда кірістірілген қауіпсіздік сүзгілерімен және көрінбейтін су таңбасымен толықтырылған мәтін немесе кескін сұрауларынан синхрондалған, жоғары ажыратымдылықтағы бейне және аудио клиптерді жасауға мүмкіндік береді.
Google DeepMind Veo 3 кесу жиегін білдіреді мәтінді бейнеге айналдыру, бірінші рет ауқымды генеративті AI үлгісі біркелкі синхрондалады жоғары дәлдіктегі бейне бірге ілеспе аудио—соның ішінде диалог, дыбыс әсерлері және қоршаған дыбыс көріністері.
өзек Мүмкіндіктер және мүмкіндіктер
- 8 секундтық бейнеклиптер: Сегіз секундқа дейінгі реттіліктерді біркелкі түсіру ауысуларымен және тігістермен жасайды.
- Біріктірілген дыбыс генерациясы: Диалогты, қоршаған шуылды, дыбыс әсерлерін және фондық музыканы бір өтуде шығарады.
- Ажыратымдылығы жоғары шығыс: дейін ажыратымдылықты қолдайды 4K (3840 × 2160) тұрақты жарықтандырумен, шынайы физикамен және егжей-тегжейлі көрініс текстураларымен.
- Көп модальды кірістер: екеуін де қабылдайды мәтіннен бейнеге және суреттен бейнеге әмбебап шығармашылық жұмыс процестеріне мүмкіндік беретін шақырулар.
Бұл мүмкіндіктер жасаушыларға аудио пост-өндіріс немесе күрделі өңдеу желілерінсіз жақын кинематографиялық әңгімелерді жасауға мүмкіндік береді.
Техникалық Толығырақ
Veo 3 архитектурасы a мультимодальды трансформатор бойынша жаттықты миллиондаған YouTube бейнелері, оның кодтаушы-декодер құрылымы a арқылы мәтіндік сұрауларды өңдейді бейне токенизация қабаты, қозғаушы кеңістік-уақыттық мүмкіндіктерді генерациялау визуалды синтез модулі. Сонымен қатар, а дыбыс синтезі саласы тураланған дыбыс шығыстарын шығарады. А кросс-модальды зейін механизмі қамтамасыз етеді көру және аудио модальділіктер десинхронизация артефактілерін азайта отырып, тығыз байланысты болып қалады. Тренинг қатысты миллиардтаған параметр жаңартулары, арқылы оңтайландырылған аралас дәлдіктегі GPU кластерлері Google бұлтында Vertex AI платформа.
Эталондық өнімділік
Ішкі көрсеткіштерде Veo 3 көрсетеді:
- PSNR (Шың сигналдың шуылға қатынасы). 38 дБ стандартты бейне деректер жиынтығы бойынша Veo 2-ден асып түседі 4 дБ.
- SSIM (Құрылымдық ұқсастық индексі) ұпайлары 0.92, жоғары көрнекі дәлдікті көрсетеді.
- Аудио-бейне синхрондау қатесі төменде 15 мс, дыбыс пен қозғалыс арасындағы байқалмайтын артта қалуды қамтамасыз ету.
- Қорытынды шығару жылдамдығы:~Секундына 12 кадр NVIDIA A100 графикалық процессорында қысқа клиптер үшін нақты уақыт режимінде жасауға мүмкіндік береді.
Бұл көрсеткіштер Veo 3-ті генеративті бейне интеллектінің алдыңғы қатарында орналастырады, Сора мен Метаның соңғы бейне үлгілері сияқты замандастарды басып озады. сапа және синхрондау.
Модельдік нұсқалар және эволюция
- Veo 1 (2024 ж. мамыр): Google I/O 2024-те іске қосылды, енгізілді 1080p дыбыссыз бейне бір минуттан астам ұрпақ.
- Veo 2 (2024 ж. желтоқсан): дейін жаңартылды 4K қолдауы жақсартылды физикалық динамика түсіну.
- Veo 3 (2025 жылдың мамыры): Қосылды дыбыс синтезі, күшейтілген реализм, және 4K шығу, айтарлықтай секіруді білдіреді мультимодальды ұрпақ.
CometAPI-ден Veo 3 API-ге қалай қоңырау шалуға болады
Veo 3 CometAPI ішіндегі API бағасы, ресми бағадан төмен:
| Модель атауы | баға |
|---|---|
| veo3-pro | $2 |
| veo3-жылдам | $0.4 |
| veo3 | $2 |
| veo3-pro-кадрлары | $0.4 |
veo3,veo3-pro,veo3-fast,veo3-pro-frames:Бұл Google ресми түрде іске қосқан соңғы бейне буын үлгісі. Жасалған бейнелерде дыбыс бар. Бұл әлемдегі дыбысы бар жалғыз бейне моделі. veo3-pro-frames бірінші кадр режимін қолдайды. Бұл модель openai чатының стандартты пішіміндегі қоңырауға сәйкес келеді
Қажетті қадамдар
- Жүйеге кіріңіз cometapi.com. Егер сіз әлі біздің пайдаланушы болмасаңыз, алдымен тіркеліңіз
- Интерфейстің кіру тіркелгі деректерінің API кілтін алыңыз. Жеке орталықтағы API токеніндегі «Токенді қосу» түймесін басыңыз, таңбалауыш кілтін алыңыз: sk-xxxxx және жіберіңіз.
- Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/
Код мысалы
- “
veo3-pro”etc соңғы нүктесі API сұрауын жіберуге және сұраудың негізгі бөлігін орнатуға арналған. Сұрау әдісі мен сұрау мәтіні біздің веб-сайт API құжатынан алынған. Сондай-ақ біздің веб-сайт сізге ыңғайлы болу үшін Apifox сынағын ұсынады. - түрлендіру BASE_URL қолданбаңызда біздің интерфейс мекенжайымызға.URL мекенжайы арнайы қолданба қажеттіліктерімен анықталады.
- Ауыстыру тіркелгіңізден нақты CometAPI кілтімен.
Егер сізде қоңырауға қатысты сұрақтарыңыз болса немесе бізге қандай да бір ұсыныстарыңыз болса, бізбен әлеуметтік желі және электрондық пошта мекенжайы арқылы хабарласыңыз support@cometapi.com.
Қолдану жағдайлары:
Бейне жасау тапсырмасын жіберу (Құжат: қол жетімді жерде): https://api.cometapi.com/veo/v1/video/create
Бейнені құру күйін сұрау: https://api.cometapi.com/veo/v1/video/query/{taskId}
API коды CometAPI пайдалану мысалы
import requests
def main():
url = " https://api.cometapi.com/veo/v1/video/create"
payload = {
"model": "veo3-pro",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if name == "main":
main()
Сондай-ақ, қараңыз 3 жылы Google Veo 3 пайдаланудың 2025 әдісі



