Midjourney đã chính thức ra mắt công cụ tạo video AI đầu tay của mình, V1 Video Model, đánh dấu sự mở rộng đáng kể về khả năng sáng tạo của công ty vượt ra ngoài hình ảnh tĩnh. Tính năng này hiện khả dụng cho tất cả người dùng đăng ký và cho phép họ tạo các clip video hoạt hình dài 5 giây từ một hình ảnh tĩnh duy nhất, với lời nhắc văn bản tùy chọn để hướng dẫn chuyển động và phong cách.
Các tính năng chính của mô hình video V1
- Hoạt hình từ hình ảnh sang video: Người dùng có thể tải lên hình ảnh của riêng mình hoặc sử dụng hình ảnh có sẵn do Midjourney tạo ra để tạo ra bốn biến thể video dài 5 giây. Các hình ảnh động mang lại sức sống cho hình ảnh tĩnh bằng cách sử dụng chuyển động mượt mà của máy ảnh và vật thể.
- Thời gian phát lại có thể kéo dài:Các clip đầu tiên dài 5 giây, nhưng người dùng có thể kéo dài mỗi video thêm bốn lần, mỗi lần 4 giây, tối đa là 20–21 giây.
- Chế độ chuyển động:
- Chuyển động thấp: Hiệu ứng tinh tế cho hầu hết các cảnh tĩnh.
- Chuyển động cao: Được thiết kế cho những cảnh có chuyển động xoay máy quay hoặc chuyển động của nhân vật đáng kể.
- Lời nhắc tùy chỉnh: Chuyển động có thể được hướng dẫn bằng lời nhắc văn bản, cho phép người dùng ra lệnh chuyển động của camera, hành động của đối tượng hoặc chuyển tiếp.
- Hai phong cách hoạt hình:
- Chế độ Tự động: Tự động tạo hoạt ảnh từ hình ảnh.
- Chế độ thủ công: Cho phép chỉnh sửa nhanh trước khi kết xuất hình ảnh động.
Một tầm nhìn vượt ra ngoài những đoạn clip ngắn
Tổng giám đốc điều hành của Midjourney, David Holz, tuyên bố rằng mô hình này không chỉ là tạo ra B-roll hay quảng cáo thời trang. Nó đại diện cho một bước quan trọng hướng tới mục tiêu dài hạn của công ty: xây dựng một hệ thống mô phỏng thế giới mở theo thời gian thực, do AI điều khiển. Tầm nhìn đầy tham vọng này bao gồm:
- Một không gian 3D tương tác hoàn toàn, nơi người dùng có thể di chuyển tự do.
- Kết xuất hình ảnh và phản hồi cảnh theo thời gian thực.
- Nhân vật và môi trường động phản ứng với hành động của người dùng.
Để đạt được điều này, Midjourney đang triển khai các thành phần cơ bản theo từng giai đoạn:
- Tạo hình ảnh (hoàn thành)
- Video hoạt hình (đã ra mắt)
- Tương tác 3D (đang phát triển)
- Tối ưu hóa kết xuất thời gian thực (đã lên kế hoạch)
Khả năng sử dụng và giá cả
- Quyền truy cập đăng ký:Với mức giá 10 đô la/tháng, phiên bản V1 được định vị là công cụ sáng tạo dễ tiếp cận dành cho nghệ sĩ và người sáng tạo nội dung.
- Chi phí kết xuất:Một loạt 20 clip mở rộng (tổng cộng ~80 giây) sẽ tiêu tốn khoảng một “giờ nhanh”, với chi phí khoảng 4 đô la—mức giá thấp hơn so với các đối thủ cạnh tranh như Veo 3 của Google.
- Chất lượng video: Mặc dù không vượt trội hơn đáng kể so với các đối thủ như Dream Machine của Luma Labs, Midjourney vẫn duy trì được mức độ trung thực hình ảnh cao. Mỗi khung hình giống như một bức tranh kỹ thuật số với tính thẩm mỹ điện ảnh.
Hạn chế
- Không hỗ trợ âm thanh:Không giống như Veo 3 hay Dream Machine, mô hình của Midjourney hiện không tạo ra nhạc nền hoặc âm thanh xung quanh.
- Biên tập ràng buộc: Không có chức năng chỉnh sửa dòng thời gian, chuyển cảnh hoặc liên kết phân đoạn.
- Thời gian kết xuất: Tốc độ tạo ra có thể chậm hơn đôi chút so với các đối thủ cạnh tranh khi xử lý các cảnh phức tạp.
Phong cảnh cạnh tranh
Midjourney gia nhập vào một lĩnh vực cạnh tranh đông đảo bao gồm Runway, Luma Labs, Veo 3 của Google và Hailuo 02 của MiniMax.
Điểm mạnh:
- Tích hợp liền mạch với quy trình tạo hình ảnh của Midjourney.
- Giao diện người dùng trực quan và khả năng truy cập tiết kiệm chi phí.
- Thích hợp cho nội dung thử nghiệm dạng ngắn.
Điểm yếu:
- Không có âm thanh.
- Biên tập và thời lượng cảnh quay có hạn.
- Độ phân giải cố định ở 480p (độ nét tiêu chuẩn).
Cách tạo video
- Tham gia vào cuộc bất hòa giữa hành trình: Đảm bảo bạn đang ở trong kênh có Midjourney Bot đang hoạt động. Nếu không, hãy thêm bot vào máy chủ của bạn hoặc tham gia máy chủ Midjourney chính thức.
- Gọi lệnh Video: Sử dụng
/imaginelệnh với lời nhắc mô tả của bạn, thêm vào--videotham số. Ví dụ:
/imagine “a floating lantern drifting over a serene lake at sunset” --video
- Tùy chỉnh thời lượng (Tùy chọn): Theo mặc định, V1 tạo ra một clip dài 10 giây, nhưng bạn có thể điều chỉnh độ dài lên đến 20 giây bằng
--duration. Ví dụ:
/imagine “city skyline at dawn” --video --duration 20s
- Chờ đợi thế hệ: Bot xử lý yêu cầu của bạn và gửi tệp video hoặc liên kết. Thời gian xử lý có thể thay đổi tùy theo tải máy chủ và cấp đăng ký của bạn.
- Tải xuống hoặc Chia sẻ: Sau khi tạo xong, hãy nhấp vào liên kết được cung cấp để xem, tải xuống hoặc chia sẻ video của bạn trên nhiều nền tảng.
Tuân thủ và An toàn
Midjourney thực thi các hướng dẫn nghiêm ngặt:
- Chỉ những hình ảnh có quyền sử dụng hợp pháp mới được tải lên.
- Việc tạo ra nội dung phản cảm, khiêu dâm hoặc kích động, đặc biệt là liên quan đến người thật, đều bị nghiêm cấm.
- Hệ thống tự động lọc các vi phạm mà không tính phí thời gian GPU.
Sự ra mắt này đánh dấu bước đi nghiêm túc của Midjourney vào thế hệ video và đặt nền tảng cho tham vọng lớn hơn của công ty trong thế giới AI tương tác. Mặc dù chưa phải là bộ công cụ làm phim hoàn chỉnh, nhưng nó cung cấp một công cụ dễ tiếp cận và hấp dẫn về mặt hình ảnh cho sự sáng tạo dạng ngắn.
Sử dụng MidJourney trong CometAPI
CometAPI cung cấp quyền truy cập vào hơn 500 mô hình AI, bao gồm các mô hình đa phương thức chuyên biệt và mã nguồn mở cho trò chuyện, hình ảnh, mã, v.v. Điểm mạnh chính của nó nằm ở việc đơn giản hóa quy trình tích hợp AI phức tạp theo truyền thống.
Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp API giữa hành trình và API Video Midjourneyvà bạn có thể dùng thử miễn phí trong tài khoản của mình sau khi đăng ký và đăng nhập! Chào mừng bạn đến đăng ký và trải nghiệm CometAPI.CometAPI trả tiền khi bạn sử dụng.
Sử dụng v7 để tạo hình ảnh: Trước khi sử dụng MidJourney V7 để tạo hình ảnh, bạn cần Bắt đầu xây dựng trên CometAPI ngay hôm nay – đăng ký ở đây để truy cập miễn phí. Vui lòng truy cập tài liệu. Bắt đầu với MidJourney V7 rất đơn giản—chỉ cần thêm --v 7 tham số ở cuối lời nhắc của bạn. Lệnh đơn giản này yêu cầu CometAPI sử dụng mô hình V7 mới nhất để tạo hình ảnh của bạn.
Tạo video: Các nhà phát triển có thể tích hợp tạo video thông qua RESTful API. Cấu trúc yêu cầu điển hình (minh họa)
curl --
location
--request POST 'https://api.cometapi.com/mj/submit/video' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'
