Trong những tuần gần đây, hai diễn biến chính đã đưa Midjourney trở lại tâm điểm chú ý: bản phát hành alpha được mong đợi từ lâu của mẫu V7 và vụ kiện bản quyền gây chú ý do Disney và Universal đệ trình. Trong khi V7 hứa hẹn cải thiện đáng kể chất lượng hình ảnh, nhiều người dùng vẫn tiếp tục gặp phải hiện tượng JPEG "khối" hoặc "rung" bất ngờ khi lưu và chia sẻ tác phẩm sáng tạo của họ. Bài viết này khám phá nguyên nhân gốc rễ của những hiện tượng này, giải thích cách nén JPEG hoạt động và đưa ra các chiến lược thực tế để giảm thiểu hiện tượng méo không mong muốn trong hình ảnh do Midjourney tạo ra.
Midjourney V7 là gì?
Midjourney V7 là phiên bản thiết kế lại mô hình từ đầu đầu tiên sau hơn một năm, mang đến tốc độ xử lý nhanh hơn, khả năng diễn giải thông tin nhanh hơn và độ trung thực hình ảnh được cải thiện.
Những cải tiến chính trong V7
- Chi tiết và tính mạch lạc được nâng cao:Theo ghi chú phát hành của Midjourney, V7 mang lại độ phân giải kết cấu cao hơn đáng kể và khả năng hiển thị các yếu tố phức tạp nhất quán hơn—bàn tay, nếp vải và cảnh quan thiên nhiên đều có độ dốc mượt mà hơn và chi tiết tốt hơn so với V6.1.
- Cá nhân hóa theo mặc định: V7 là mẫu Midjourney đầu tiên có mô hình “cá nhân hóa” mặc định, yêu cầu người dùng đánh giá khoảng 200 hình ảnh mẫu để mở khóa trải nghiệm được cá nhân hóa hoàn toàn. Vòng phản hồi này giúp hệ thống căn chỉnh đầu ra tốt hơn với sở thích thẩm mỹ của từng cá nhân.
Bản phát hành Alpha và quyền truy cập cộng đồng
Midjourney đã mở V7 để thử nghiệm alpha vào đầu tháng 2025 năm XNUMX. Các thành viên cộng đồng có thể truy cập mô hình mới bằng cách thêm --v 7 đánh dấu vào lời nhắc của họ hoặc thông qua kênh V7 chuyên dụng. Bản phát hành alpha này cho phép thử nghiệm rộng hơn các cải tiến cốt lõi của mô hình—hiểu biết nhanh chóng, chất lượng hình ảnh và tính nhất quán—trước khi triển khai công khai hoàn toàn.
Tại sao tôi lại thấy hiện tượng nhiễu JPEG trong ảnh Midjourney của mình?
Mặc dù V7 có kết xuất dựa trên PNG nội bộ, nhiều người dùng vẫn báo cáo hiện tượng nén theo kiểu JPEG. Những hiện tượng méo hình có thể nhìn thấy này thường phát sinh trong quá trình xử lý hạ lưu—đặc biệt là trên các nền tảng như Discord.
Tạo PNG nội bộ và chuyển đổi JPEG bên ngoài
Bản thân Midjourney tạo và lưu trữ hình ảnh ở định dạng PNG không mất dữ liệu, đảm bảo rằng chi tiết đầy đủ và độ dốc tinh tế của mô hình được bảo toàn. Tuy nhiên, khi các tệp này được chia sẻ trên Discord hoặc tải xuống qua một số liên kết nhất định, chúng có thể được chuyển đổi sang định dạng mất dữ liệu (JPEG hoặc WebP) để tiết kiệm băng thông.
Nén tự động của Discord
Theo mặc định, Discord mã hóa lại hình ảnh lớn để giảm kích thước tệp, thường sử dụng nén JPEG hoặc WebP. Bước tự động này tạo ra các hiện tượng nhiễu ranh giới khối ("macroblocking") và các thay đổi màu nhẹ, có thể đặc biệt dễ nhận thấy ở các vùng nền đồng nhất hoặc vùng chuyển màu mượt mà.
Nén lại do quy trình công việc gây ra
Mặc dù Midjourney tạo và lưu trữ hình ảnh nội bộ dưới dạng PNG không mất dữ liệu hoặc thậm chí là các biểu diễn có độ chính xác cao hơn, ngay khi bạn chọn "Lưu dưới dạng JPEG" hoặc chia sẻ qua các nền tảng tự động chuyển đổi sang JPEG (ví dụ: một số thư viện web, phương tiện truyền thông xã hội), các hiện tượng lạ sẽ xuất hiện. Proxy hình ảnh của Discord, trình duyệt lưu bản xem trước dưới dạng WebP và chuyển đổi thông qua nhấp chuột phải "Lưu hình ảnh dưới dạng..." đều kích hoạt nén lại. Mỗi bước nén lại đều tích lũy tổn thất thế hệ: cắt xén, thay đổi kích thước hoặc mã hóa lại ở cài đặt chất lượng mặc định (thường là khoảng 75–85%) khuếch đại hiện tượng chặn và dải.
Nén JPEG tạo ra hiện tượng nhiễu như thế nào?
Hiểu được nền tảng kỹ thuật của mã hóa JPEG sẽ giúp làm sáng tỏ lý do tại sao hiện tượng nhiễu xuất hiện và cách khắc phục chúng.
DCT dựa trên khối và lượng tử hóa
Nén JPEG hoạt động bằng cách chia một hình ảnh thành các khối pixel 8×8 và áp dụng phép biến đổi cosin rời rạc (DCT) cho mỗi khối. Để giảm kích thước tệp, nó lượng tử hóa các thành phần tần số cao—thực sự loại bỏ các chi tiết tốt. Khi mức lượng tử hóa quá cao (tức là nén mạnh hơn), quá trình này dẫn đến ranh giới khối có thể nhìn thấy, mất kết cấu và dải màu. Hình ảnh do AI tạo ra, đặc biệt là những hình ảnh có độ dốc phức tạp và kết cấu tốt, rất dễ bị các hiện tượng này nếu được lưu hoặc truyền dưới dạng JPEG mà không có đủ cài đặt chất lượng.
Các loại hiện vật phổ biến
- Chặn (Chặn vĩ mô):Khi toàn bộ các khối 8×8 trở nên rõ ràng và riêng biệt, tạo ra họa tiết “bàn cờ”.
- Hiệu ứng chuông/đường viền: Sự biến dạng giống như hào quang dọc theo các cạnh sắc nét, phát sinh do mất thành phần tần số cao.
- Dải màu: Các dải màu mượt mà sẽ giảm xuống thành các “dải” màu riêng biệt khi những khác biệt nhỏ bị loại bỏ.
Midjourney hỗ trợ những định dạng tệp nào và chúng đã thay đổi như thế nào gần đây?
Những định dạng nào là định dạng gốc của Midjourney?
Theo mặc định, Midjourney cung cấp các tệp PNG có độ phân giải cao—hình ảnh không mất dữ liệu, 8 bit trên mỗi kênh (24 bit RGB) giữ nguyên mọi giá trị pixel. Khi bạn nâng cấp hoặc sử dụng chế độ "Nâng cấp nhẹ", bạn vẫn nhận được PNG qua nút tải xuống thư viện web. Tuy nhiên, hình thu nhỏ xem trước được hiển thị trực tiếp trong Discord được phục vụ dưới dạng WebP (một định dạng hiện đại có mất dữ liệu/không mất dữ liệu tùy chọn) để tăng tốc độ tải. Tùy thuộc vào trình duyệt hoặc ứng dụng khách Discord của bạn, tải xuống bằng cách nhấp chuột phải có thể lấy hình thu nhỏ WebP thay vì PNG đầy đủ.
Tại sao một số người dùng đột nhiên gặp phải đầu ra JPEG?
Một số yếu tố thúc đẩy quá trình chuyển đổi JPEG không tự nguyện:
- Đường ống của bên thứ ba: Nếu bạn định tuyến hình ảnh Midjourney thông qua bot hoặc công cụ tự động hóa mặc định lưu dưới dạng JPG cho các tải trọng nhỏ hơn, bạn sẽ thừa hưởng các hiện vật.
- Các tập lệnh xử lý hàng loạt: Một số trình nâng cấp cộng đồng (ví dụ: Automatic1111 cho Stable Diffusion) lưu đầu ra ở cùng định dạng với đầu vào—biến PNG cuối cùng trở lại thành JPG nếu được nối sau JPG.
- Mặc định của nền tảng: Các nền tảng truyền thông xã hội như Instagram hoặc Twitter tự động nén các ảnh do người dùng tải lên thành định dạng JPEG, làm giảm chất lượng hình ảnh hơn nữa.
Làm thế nào để giảm thiểu hiện tượng nhiễu JPEG trong hình ảnh của bạn?
Mặc dù bạn không thể thay đổi chính sách nén mặc định của Discord, nhưng bạn có thể tối ưu hóa quy trình làm việc của mình để giữ nguyên độ trung thực của hình ảnh.
Sử dụng định dạng không mất dữ liệu và xuất bitrate cao hơn
- Tải xuống PNG trực tiếp: Luôn tải xuống phiên bản PNG của hình ảnh từ ứng dụng web Midjourney thay vì dựa vào bản xem trước Discord. PNG tránh được những nhược điểm về lượng tử hóa của JPEG.
- Chỉ định chất lượng cao hơn: Nếu bạn phải sử dụng JPEG (để phân phối trên web, v.v.), hãy xuất ở cài đặt chất lượng 90–100% để giữ lại nhiều hệ số DCT hơn và giảm ranh giới khối có thể nhìn thấy.
Điều chỉnh quy trình làm việc của bạn để tránh nén lại
- Bỏ qua lớp xem trước của Discord: Trong Discord, thay thế các liên kết từ
media.discordapp.netvớicdn.discordapp.comđể truy cập các bản tải lên gốc mà không cần nén bản xem trước. - Duy trì nén một bước: Chỉ mở tệp PNG gốc của bạn một lần trong trình chỉnh sửa; nếu cần tệp JPEG, hãy xuất trực tiếp mà không cần chỉnh sửa thêm hoặc lưu lại.
Tận dụng công nghệ loại bỏ hiện vật do AI cung cấp
Nghiên cứu gần đây đã tạo ra các mô hình dựa trên khuếch tán có thể loại bỏ chọn lọc các hiện vật JPEG trong khi vẫn duy trì chi tiết. Ví dụ, mô hình CODiff sử dụng bộ nhúng hình ảnh nhận biết nén (CaVE) để hướng dẫn bộ khử nhiễu khuếch tán một bước, đạt được khả năng giảm hiện vật tiên tiến với chi phí tối thiểu.
Sử dụng MidJourney trong CometAPI
CometAPI cung cấp quyền truy cập vào hơn 500 mô hình AI, bao gồm các mô hình đa phương thức chuyên biệt và mã nguồn mở cho trò chuyện, hình ảnh, mã, v.v. Điểm mạnh chính của nó nằm ở việc đơn giản hóa quy trình tích hợp AI phức tạp theo truyền thống.
Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp API giữa hành trìnhvà bạn có thể dùng thử miễn phí trong tài khoản của mình sau khi đăng ký và đăng nhập! Chào mừng bạn đến đăng ký và trải nghiệm CometAPI.CometAPI trả tiền khi bạn sử dụng.
Điều kiện tiên quyết quan trọng: Trước khi sử dụng MidJourney V7, bạn cần Bắt đầu xây dựng trên CometAPI ngay hôm nay – đăng ký ở đây để truy cập miễn phí. Vui lòng truy cập tài liệu.
Bắt đầu với MidJourney V7 rất đơn giản—chỉ cần thêm --v 7 tham số ở cuối lời nhắc của bạn. Lệnh đơn giản này yêu cầu CometAPI sử dụng mô hình V7 mới nhất để tạo hình ảnh của bạn.
Vui lòng tham khảo trước API giữa hành trình để biết thông tin chi tiết về tích hợp.
Kết luận
Bằng cách hiểu được vị trí—và lý do—các hiện vật JPEG đi vào quy trình làm việc Midjourney của bạn, bạn có thể thực hiện các bước cụ thể để bảo toàn toàn bộ tiềm năng sáng tạo của mô hình. Cho dù thông qua việc sử dụng PNG một cách chiến lược, các hoạt động xuất hợp lý hay các công cụ loại bỏ hiện vật tiên tiến, bạn đều có thể thể hiện độ trung thực đáng chú ý của V7 mà không có các tác dụng phụ không mong muốn của việc nén mất dữ liệu.
