Sau đây là hướng dẫn toàn diện về cách nâng cấp bản phác thảo thô của bạn thành tác phẩm nghệ thuật hoàn thiện bằng các công cụ AI tiên tiến của Midjourney. Chúng tôi sẽ đề cập đến mọi thứ, từ các khả năng mới nhất của nền tảng cho đến các phương pháp hay nhất để chuẩn bị bản phác thảo đầu vào của bạn, tinh chỉnh lời nhắc, tận dụng các tính năng chỉnh sửa mới và lặp lại để tạo ra các đầu ra sẵn sàng cho phòng trưng bày. Trên đường đi, bạn sẽ khám phá các mẹo thực tế - được hỗ trợ bởi các bản cập nhật mới nhất từ bản phát hành V7 của Midjourney và thông tin chi tiết của cộng đồng - để giúp bạn biến những đường nét đơn giản thành những kiệt tác tuyệt đẹp.
Midjourney là gì?
Nguồn gốc và mục đích
Midjourney là một phòng nghiên cứu độc lập và nền tảng nghệ thuật AI được thành lập để khám phá các chế độ sáng tạo mới lạ của con người thông qua các mô hình tạo sinh (). Ra mắt ở dạng beta mở vào ngày 12 tháng 2022 năm XNUMX, nền tảng này hoạt động chủ yếu thông qua Discord, cho phép các nghệ sĩ đưa ra lời nhắc bằng văn bản và hình ảnh mà AI sẽ kết xuất thành hình ảnh có độ trung thực cao.
Điểm nổi bật của phiên bản 7
Vào ngày 4 tháng 2025 năm 7, Midjourney đã công bố Phiên bản 3, bản cập nhật mô hình lớn đầu tiên của mình sau gần một năm, hứa hẹn cải thiện tính nhất quán, tốc độ và tính chân thực (). Bản phát hành này giới thiệu những cải tiến như kết xuất tay và cơ thể tốt hơn, khả năng tái sử dụng số hạt giống để có kết quả nhất quán và tham số chất lượng được tối ưu hóa giúp giảm tải GPU trong khi tăng cường chi tiết (mặc định --q 1).
Tại sao nên sử dụng Midjourney để chuyển đổi bản phác thảo?
Có gì mới trong Midjourney V7?
Midjourney đã phát hành mẫu V7 vào đầu tháng 2025 năm 7, đánh dấu bản nâng cấp lớn đầu tiên sau gần một năm và nhấn mạnh vào tính nhất quán của hình ảnh được cải thiện và giảm thời gian GPU. Phiên bản XNUMX giới thiệu một bậc chất lượng thử nghiệm mới (--q 4) để dựng hình cực kỳ chi tiết, cùng với các thiết lập mặc định được tối ưu hóa giúp tăng cường độ trung thực của bàn tay và bố cục mà không tốn thêm chi phí GPU. Hơn nữa, V7 có chế độ “Omni Reference”—cho phép kết hợp đồng thời nhiều hình ảnh và đầu vào phong cách—trao quyền cho các nghệ sĩ kết hợp liền mạch các bản phác thảo với cảm hứng phong cách.
Tính năng chuyển bản phác thảo thành hình ảnh đã phát triển như thế nào?
Khả năng phác thảo thành hình ảnh của Midjourney lần đầu tiên xuất hiện trong V6, cho phép người dùng tải lên bản vẽ đường nét và chuyển đổi nó thành một cảnh hoàn chỉnh dựa trên lời nhắc văn bản đi kèm (). Tính năng này đã hoàn thiện hơn với V6.2, tinh chỉnh cách phác thảo bằng bút chì chuyển thành kết cấu chân thực và tăng cường khả năng giữ nguyên tư thế và bố cục. V7 làm mịn hơn nữa các cạnh thô, cải thiện khả năng bảo toàn tỷ lệ và độ dày đường nét ban đầu, đồng thời tăng tốc độ kết xuất tổng thể.
Lợi ích cho nghệ sĩ
AI của Midjourney rất giỏi trong việc diễn giải các đường vẽ tay lỏng lẻo, tô họa tiết, màu sắc và ánh sáng dựa trên các mẫu hình ảnh đã học—biến các khái niệm thô thành các tác phẩm tinh xảo chỉ trong vài giây (). Quy trình làm việc lặp đi lặp lại và kiểm soát tham số của nó cho phép các nghệ sĩ khám phá các biến thể một cách nhanh chóng, khiến nó trở nên lý tưởng cho việc hình thành ý tưởng, lập bảng phân cảnh, nghệ thuật ý tưởng và vẽ kỹ thuật số.
So sánh với các công cụ AI khác
Trong khi các nền tảng như DALL‑E và Stable Diffusion cũng chuyển đổi văn bản thành hình ảnh, phương pháp tiếp cận nguồn đóng và trọng tâm nghiên cứu tự tài trợ của Midjourney tạo ra các thành phần mạch lạc hơn và bảng màu phong phú hơn, đặc biệt là khi làm việc từ các đầu vào do người dùng cung cấp như bản phác thảo. Các cuộc khảo sát người dùng gần đây xếp hạng Midjourney cao nhất về "sự đa dạng về phong cách biểu đạt" và "độ rõ nét của cạnh", chìa khóa để bảo tồn các đường phác thảo.
Bạn có thể chuẩn bị bản phác thảo cho Midjourney như thế nào?
Bản phác thảo vật lý so với bản phác thảo kỹ thuật số
Cả bản phác thảo vẽ tay và bản phác thảo trên máy tính bảng đều được, nhưng bản quét nghệ thuật đường nét sạch sẽ, có độ tương phản cao sẽ mang lại những diễn giải AI tốt nhất. Nếu làm việc trên giấy, hãy quét ở mức 300 dpi theo thang độ xám; điều chỉnh mức độ để đảm bảo phân tách rõ ràng giữa các đường và nền trước khi tải lên.
Thực hành tốt nhất về Quét và Chụp
Sử dụng máy quét phẳng hoặc ứng dụng điện thoại thông minh như Adobe Scan để tránh biến dạng phối cảnh. Cắt bỏ phần lề không cần thiết, lưu dưới dạng PNG hoặc JPEG và đảm bảo tệp nằm trong giới hạn 8 MB của Discord. Ánh sáng nhất quán và nền trung tính hỗ trợ thuật toán phát hiện cạnh của AI.
Định dạng tệp và độ phân giải nào hoạt động tốt nhất?
Bản phác thảo nên được lưu ở các định dạng raster phổ biến—PNG, JPG hoặc JPEG—để đảm bảo khả năng tương thích rộng. Để có kết quả tốt nhất, hãy cắt bản phác thảo để phù hợp với tỷ lệ khung hình mong muốn của đầu ra cuối cùng của bạn (ví dụ: 1:1 cho bài đăng trên phương tiện truyền thông xã hội hoặc 16:9 cho nền). Độ phân giải từ 1 000 × 1 000 px đến 2 000 × 2 000 px cân bằng việc chụp chi tiết mà không mất quá nhiều thời gian tải lên.
Làm thế nào để tải bản phác thảo lên Discord và giao diện Web?
Trong Discord, dán hoặc kéo tệp phác thảo của bạn vào bất kỳ kênh nào có Midjourney Bot đang hoạt động, sau đó sao chép URL được tạo của nó. Thêm tiền tố URL này vào đầu /imagine nhắc sử dụng nó như một lời nhắc hình ảnh. Trên trang Web Create, nhấp vào biểu tượng hình ảnh trong thanh Imagine để tải trực tiếp từ máy tính của bạn; sau khi tải lên, nhấp lại để chèn nó vào lời nhắc của bạn. Khóa hình ảnh thông qua biểu tượng khóa để sử dụng lại qua nhiều thế hệ.
Image Prompts giúp chuyển đổi bản phác thảo như thế nào?
Có những loại Lời nhắc hình ảnh nào?
Midjourney hỗ trợ ba quy trình làm việc chính của Image Prompt:
- Hình ảnh đơn + Văn bản:Sử dụng một bản phác thảo cùng với văn bản mô tả để hướng dẫn về màu sắc, bố cục và phong cách.
- Chỉ nhiều hình ảnh: Kết hợp hai hoặc nhiều bản phác thảo (hoặc bản phác thảo + ảnh tham khảo) không có văn bản để hợp nhất các yếu tố trực quan trực tiếp.
- Nhiều hình ảnh + văn bản: Kết hợp nhiều bản tải lên với văn bản để kiểm soát tốt hơn cảnh cuối cùng.
Làm thế nào để điều chỉnh Trọng lượng hình ảnh?
Sử dụng --iw tham số để xác định mức độ Midjourney bám chặt vào bản phác thảo của bạn. Trọng số mặc định áp dụng ảnh hưởng cân bằng, nhưng tăng dần (--iw 2 or --iw 3) nhấn mạnh hình dạng và đường nét của bản phác thảo, đồng thời giảm (--iw 0.5) mang lại cho Midjourney nhiều tự do diễn giải hơn. Các phiên bản mô hình khác nhau có sự khác nhau --iw phạm vi—kiểm tra nhật ký thay đổi của phiên bản trước khi thử nghiệm.
Lời nhắc bằng văn bản giúp cải thiện khả năng nghệ thuật của bạn như thế nào?
Nghệ thuật nhắc nhở là gì?
Ngoài hình ảnh, lời nhắc văn bản mạnh mẽ mở khóa các sắc thái về phong cách và khái niệm. Hướng dẫn “Nghệ thuật gợi ý” khuyến khích kết hợp các danh từ cụ thể (chủ ngữ), phương tiện nghệ thuật (ví dụ: “tranh sơn dầu”, “phác thảo bằng bút bi”), khoảng thời gian, mô tả ánh sáng và tính từ cảm xúc để tạo ra các hướng dẫn sống động. Ví dụ:
css/imagine <sketch_url> futuristic city skyline at dawn, watercolor style, intricate linework, soft pastel palette, cinematic lighting --q 2 --s 500
Sự pha trộn này chỉ rõ thành phần, phương tiện, phối màu và cách điệu.
Làm thế nào để sử dụng công cụ Mô tả để gợi ý ý tưởng?
Công cụ Mô tả của Midjourney phân tích hình ảnh đã tải lên và tạo ra bốn lời nhắc mẫu nắm bắt các yếu tố chính của hình ảnh đó. Để truy cập, hãy kéo bản phác thảo của bạn qua vùng "Thả hình ảnh để mô tả" trên trang Web Create hoặc sử dụng /describe trong Discord. Nhấp vào “Chạy tất cả lời nhắc” sẽ ngay lập tức điền vào thanh lời nhắc của bạn với nhiều điểm bắt đầu khác nhau, tạo ra những biến thể sáng tạo.
Làm thế nào để tận dụng các thông số về phong cách và chất lượng?
Chất lượng (--q) thiết lập thời gian đầu tư GPU:
- V7 mặc định là
--q 1(cân bằng) và cung cấp--q 4để có được thông tin chi tiết cực kỳ phong phú.--q 1(mặc định) sử dụng GPU cân bằng và chi tiết.--q 2or--q 4: Chi tiết hơn; thử nghiệm trong V7 để có độ kết hợp cực kỳ tốt (không tương thích với Omni Reference). - Giá trị thấp hơn (
--q 0.5) tạo ra các lần lặp lại nhanh hơn, lỏng lẻo hơn—lý tưởng để khám phá các sáng tác ở tốc độ nháp.
Phong cách hóa (--s) kiểm soát quyền tự do nghệ thuật:
Giá trị cách điệu thấp (--s 50) thực hiện nghiêm túc các lời nhắc.
Giá trị cao (--s 1000) cho phép diễn giải trừu tượng hơn, mang tính hội họa hơn.
Kết hợp --q và --s giúp cân bằng giữa sự trung thực với bản phác thảo của bạn với sự sáng tạo.
Các tính năng nâng cao giúp nâng tầm kiệt tác của bạn như thế nào?
Tham chiếu phong cách và tham chiếu toàn diện là gì?
A Tham khảo phong cách (--sref <url>) nhập rung cảm thị giác (màu sắc, kết cấu, ánh sáng) của một hình ảnh hiện có mà không sao chép các đối tượng cụ thể. Ví dụ, bạn có thể áp dụng phong cách "tranh sơn dầu của Vincent Van Gogh" cho bản phác thảo bầu trời đầy sao của mình. Tham khảo toàn diện, mới trong V7, cho phép kết hợp nhiều tài liệu tham khảo—văn bản, bản phác thảo, hình ảnh phong cách, bảng tâm trạng—trong một lời nhắc, mang lại khả năng kiểm soát sáng tác chưa từng có.
V7 tối ưu hóa quy trình làm việc và tính nhất quán như thế nào?
Các cải tiến mô hình cốt lõi của V7 làm giảm hiện tượng nhiễu (đặc biệt là ở các khu vực đường phức tạp) và tăng tốc chu kỳ lặp lại bằng cách tối ưu hóa việc sử dụng GPU. --q 4 chế độ này tạo ra các đầu ra cực kỳ chi tiết phù hợp để in và chế độ Remix được cập nhật cho phép bạn lấy bất kỳ hình ảnh nào được tạo ra và sửa đổi các tham số nhắc nhở cụ thể mà không cần nhắc lại bản phác thảo cơ sở.
Những phương pháp và mẹo tốt nhất nào có thể giúp bạn tối đa hóa kết quả?
Làm thế nào để lặp lại hiệu quả với Remix và Variations?
Sử dụng các nút Discord “V1–V4” để tạo các biến thể của bất kỳ bản tổng hợp nào, duy trì thành phần cốt lõi trong khi khám phá các tinh chỉnh về phong cách. Bật chế độ phối lại (/prefer remix) để thay đổi hậu tố nhắc nhở như --s 200 or --q 4 trực tiếp trên các đầu ra hiện có, bỏ qua nhu cầu tải lại các bản phác thảo. Khóa bản phác thảo chính của bạn vào thanh Imagine, sau đó lặp lại tự do trên các điều chỉnh về kiểu dáng hoặc chất lượng phụ.
Làm thế nào để cân bằng giữa tính sáng tạo và tính mạch lạc?
- Bắt đầu lỏng lẻo: Tạo bản phác thảo nhanh với chi phí thấp
--qvà vừa phải--sđể chặn các biểu mẫu. - Tinh chỉnh tiêu điểm: Tăng
--qvà thấp hơn--sđể căn chỉnh đầu ra chặt chẽ hơn với các đường phác thảo của bạn. - Tiêm nghệ thuật: Thêm URL tham chiếu kiểu hoặc tăng cường
--sđể có vẻ ngoài biểu cảm, giống như họa sĩ. - Tinh chỉnh chi tiết: Sử dụng
--upbetahoặc tính năng Biên tập trên Web để thực hiện các điều chỉnh chính xác (ví dụ, làm sắc nét các đặc điểm trên khuôn mặt hoặc điều chỉnh cân bằng màu sắc).
Làm thế nào để khắc phục những sự cố thường gặp?
- Sự trừu tượng quá mức: Nếu kết quả đầu ra quá khác biệt, hãy giảm kiểu dáng hoặc bỏ qua các tham chiếu kiểu dáng.
- Mất độ rõ nét của đường nét: Tăng trọng lượng hình ảnh (
--iw) hoặc chất lượng để gia cố các cạnh được phác thảo. - Những hiện vật bất ngờ: Chuyển đổi phiên bản mô hình (ví dụ: thử V6.1 cho một số thành phần nhất định) hoặc điều chỉnh giá trị hạt giống (
--seed) để đảm bảo tính nhất quán.
Kết luận
Biến các bản phác thảo thô thành tác phẩm nghệ thuật chuyên nghiệp với Midjourney phụ thuộc vào việc kết hợp những tiến bộ mới nhất của mô hình nền tảng này—đặc biệt là các tối ưu hóa chất lượng của V7 và Omni Reference—với kỹ thuật nhắc nhở nghiêm ngặt và tinh chỉnh lặp đi lặp lại. Bằng cách chuẩn bị các bản phác thảo ở các định dạng và tỷ lệ khung hình tương thích, tận dụng Image Prompts cùng với văn bản mô tả, điều chỉnh các thông số như chất lượng và phong cách, và khám phá các tính năng nâng cao như Style References và chế độ Remix, các nghệ sĩ có thể tạo ra những kiệt tác riêng biệt, có độ trung thực cao. Khi các công cụ nghệ thuật AI tiếp tục phát triển, việc theo kịp các tính năng mới và các phương pháp hay nhất của cộng đồng sẽ trao quyền cho những người sáng tạo để vượt qua ranh giới của việc kể chuyện trực quan.
Sử dụng MidJourney V7 trong CometAPI
CometAPI cung cấp quyền truy cập vào hơn 500 mô hình AI, bao gồm các mô hình đa phương thức chuyên biệt và mã nguồn mở cho trò chuyện, hình ảnh, mã, v.v. Điểm mạnh chính của nó nằm ở việc đơn giản hóa quy trình tích hợp AI phức tạp theo truyền thống.
Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp API giữa hành trìnhvà bạn sẽ nhận được 1 đô la trong tài khoản của mình sau khi đăng ký và đăng nhập! Chào mừng bạn đến đăng ký và trải nghiệm CometAPI.CometAPI trả tiền khi bạn sử dụng.
Điều kiện tiên quyết quan trọng: Trước khi sử dụng MidJourney V7, bạn cần Bắt đầu xây dựng trên CometAPI ngay hôm nay – đăng ký ở đây để truy cập miễn phí. Vui lòng truy cập tài liệu
Bắt đầu với MidJourney V7 rất đơn giản—chỉ cần thêm --v 7 tham số ở cuối lời nhắc của bạn. Lệnh đơn giản này yêu cầu CometAPI sử dụng mô hình V7 mới nhất để tạo hình ảnh của bạn.
Vui lòng tham khảo trước API giữa hành trình để biết thông tin chi tiết về tích hợp.
