Veo 3.1-Fast là gì?
Veo 3.1-Fast là một phiên bản tối ưu cho tốc độ của dòng mô hình video sinh thành Veo 3.1 của Google. Nó được tối ưu hóa đặc biệt để giảm độ trễ và chi phí cho video ngắn (phù hợp phát trên mạng xã hội) đồng thời giữ lại độ trung thực nghe-nhìn cao hơn được giới thiệu trong Veo 3.1. So với các phiên bản Veo trước đây, Veo 3.1 và Veo 3.1-Fast bổ sung khả năng tạo âm thanh gốc phong phú hơn, khả năng bám sát gợi ý mạnh hơn, và các quy trình biên tập mới (ví dụ: nội suy khung đầu/cuối, "video footage," và mở rộng cảnh).
Tính năng cốt lõi
Dòng mô hình/kiến trúc (Tổng quan): Veo 3.1 là một mô hình video sinh thành không gian-thời gian trong dòng Veo (được công khai dẫn chiếu là dựa trên các mẫu thiết kế diffusion và Transformer), tích hợp tổ hợp nghe-nhìn và các công cụ chuyên dụng cho biên tập/mở rộng.
Âm thanh gốc và đồng bộ: Một tính năng then chốt của Veo 3.1 là âm thanh gốc phong phú hơn và nhận biết ngữ cảnh tốt hơn: thoại, âm thanh môi trường và hiệu ứng âm thanh được tạo đồng bộ với hình ảnh (khả năng âm thanh này đã được mở rộng sang quy trình ảnh → video và các tính năng biên tập/mở rộng).
Độ trễ/Thông lượng (Cân đối kỹ thuật): So với phiên bản ưu tiên chất lượng (Quality-First), phiên bản "Fast" được tối ưu để giảm độ trễ và chi phí trên mỗi giây video; tối ưu này thường dẫn đến thời gian tạo giảm đáng kể (nhiều báo cáo thực tế và ghi chú từ nhà cung cấp cho thấy tốc độ nhanh hơn khoảng 2x trong các tình huống video ngắn điển hình, tùy theo độ phân giải và tải). Thời gian chạy chính xác sẽ thay đổi tùy theo tầng hạ tầng, độ phân giải và hàng đợi.
Thông số kỹ thuật
Mục đích chính: Tạo nhanh văn bản → video và hình ảnh → video cho các quy trình sáng tạo gọn nhẹ, tốc độ cao—dùng để dựng mẫu, video ngắn mạng xã hội và tạo nội dung trong ứng dụng.
Độ dài đầu ra điển hình (được phép): Dòng Veo 3.1 hỗ trợ các video ngắn độ dài cố định; API cung cấp tùy chọn 4 giây, 6 giây và 8 giây, đồng thời hỗ trợ quy trình mở rộng có kiểm soát (mở rộng cảnh thông qua các "bước nhảy" nhỏ). Các tùy chọn độ dài này và cơ chế mở rộng cảnh phát hành trong Veo 3.1 được liệt kê trong tài liệu công khai và nhật ký thay đổi.
Độ phân giải và tỉ lệ khung hình: Đầu ra tiêu chuẩn bao gồm 720p và (tỉ lệ 16:9) 1080p, 4K; hỗ trợ cả tỉ lệ 16:9 và 9:16 (9:16 chủ yếu dành cho nền tảng di động/mạng xã hội).
Đầu vào: Gợi ý văn bản tự do, hình ảnh tham chiếu tùy chọn (Veo 3.1 hỗ trợ tới nhiều hình ảnh), và các khung bắt đầu/kết thúc rõ ràng để nội suy hoặc tiếp tục từ khung cuối trong một số quy trình biên tập.
Cách truy cập Quick API của Veo 3.1
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa có tài khoản, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI của bạn. Lấy khóa API, thông tin xác thực truy cập của bạn. Trong hồ sơ của bạn, dưới mục API Tokens, nhấp "Add Token", lấy khóa token: sk-xxxxx, và gửi.
Bước 2: Gửi yêu cầu tới Veo 3.1 Fast API
Chọn endpoint "\veo3.1-fast\" để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu có trong tài liệu API trên trang web của chúng tôi. Để thuận tiện, trang web của chúng tôi cũng cung cấp công cụ kiểm thử Apifox. Vui lòng thay thế bằng CometAPI key thực tế trong tài khoản của bạn.
Nhập gợi ý video hoặc hình ảnh tham chiếu của bạn trong trường Content (bạn có thể tải lên hoặc dùng URL)—mô hình sẽ phản hồi theo đó. Xử lý phản hồi API để lấy kết quả được tạo. Tạo video Veo3 bất đồng bộ qua POST /v1/videos trong CometAPI, trả về ID tác vụ và hỗ trợ hướng dẫn khung đầu/cuối cho các clip tối đa 8 giây.
Ngoài ra, bạn có thể dùng playground trên trang mô hình Veo 3.1 Fast của chúng tôi để tạo video dễ dàng và nhanh chóng mà không cần lập trình.
Bước 3: Lấy và kiểm tra kết quả
Sau một thời gian ngắn, video sẽ được tạo. Phản hồi API sẽ cung cấp một liên kết video; vui lòng tải xuống kịp thời.
Để biết thêm thông tin về Veo 3.1, vui lòng tham khảo veo tài liệu video.