GPT Image 2 là gì?
GPT Image 2 là mô hình tạo sinh hình ảnh tiên tiến nhất của OpenAI, được tích hợp trực tiếp vào ChatGPT dưới tên ChatGPT Images 2.0. Không giống các công cụ độc lập trước đây như DALL·E 3, nó kết hợp khả năng hiểu ngôn ngữ của dòng GPT với tổng hợp thị giác tiên tiến. Mô hình tạo ra hình ảnh chính xác, có thể sử dụng, được tối ưu cho các tác vụ chuyên nghiệp thay vì chỉ thử nghiệm nghệ thuật thuần túy.
Các khả năng chính
- Kết xuất văn bản gần như hoàn hảo: Đạt độ chính xác ở mức ký tự khoảng ~99%, kết xuất văn bản rõ ràng và chính xác theo ngữ cảnh bằng tiếng Anh và các hệ chữ phi Latinh. Xử lý các đoạn dài, menu, poster và infographic mà không gặp lỗi kiểu chữ như ở các mô hình trước.
- Bố cục phức tạp với độ trung thực cao: Tạo đầu ra có cấu trúc như mockup UI, sơ đồ mặt bằng, trực quan hóa dữ liệu, slide, bản đồ, trang manga và lưới nhiều phần tử (ví dụ: ma trận biểu tượng 10x10 hoặc poster sản phẩm).
- Hỗ trợ đa ngôn ngữ và văn hóa: Tạo văn bản chính xác và hình ảnh phù hợp văn hóa bằng nhiều ngôn ngữ.
- Chỉnh sửa hình ảnh và xử lý tham chiếu: Áp dụng chỉnh sửa lên hình ảnh tải lên trong khi vẫn giữ chi tiết, khuôn mặt và phong cách với độ nhất quán cao.
- Tạo theo lô: Tạo tối đa 8 hình ảnh nhất quán từ một prompt, duy trì sự nhất quán của nhân vật và đối tượng trong toàn bộ tập.
- Tính chân thực như ảnh và khả năng sử dụng: Đầu ra trông tự nhiên hơn và sẵn sàng cho sản xuất, với ít tạo tác hơn, biểu tượng tốt hơn và bố cục chuyên nghiệp.