GPT Image 2 là gì?
GPT Image 2 là mô hình tạo ảnh tối tân của OpenAI, được tích hợp trực tiếp vào ChatGPT dưới tên ChatGPT Images 2.0. Không giống các công cụ độc lập trước đây như DALL·E 3, mô hình này kết hợp khả năng hiểu ngôn ngữ của dòng GPT với tổng hợp hình ảnh tiên tiến. Mô hình tạo ra hình ảnh chính xác, usable, được tối ưu cho các tác vụ chuyên nghiệp thay vì chỉ phục vụ thử nghiệm mang tính nghệ thuật.
Khả năng chính
- Hiển thị văn bản gần như hoàn hảo: Đạt độ chính xác cấp ký tự khoảng ~99%, hiển thị văn bản rõ ràng, đúng ngữ cảnh bằng tiếng Anh và các hệ chữ phi La-tinh. Xử lý tốt các đoạn dài, thực đơn, poster và infographic mà không gặp lỗi chữ méo mó thường thấy ở các mô hình trước.
- Khả năng dàn bố cục phức tạp với độ trung thực cao: Tạo ra kết quả có cấu trúc như bản dựng UI, bản vẽ mặt bằng, trực quan hóa dữ liệu, trang trình chiếu, bản đồ, trang manga và lưới nhiều phần tử (ví dụ: ma trận biểu tượng 10x10 hoặc poster sản phẩm).
- Hỗ trợ đa ngôn ngữ và văn hóa: Tạo văn bản chính xác và hình ảnh phù hợp với bối cảnh văn hóa ở nhiều ngôn ngữ.
- Chỉnh sửa ảnh và xử lý tham chiếu: Áp dụng chỉnh sửa lên ảnh đã tải lên đồng thời bảo toàn chi tiết, khuôn mặt và phong cách với mức độ nhất quán cao.
- Tạo theo lô: Tạo tối đa 8 ảnh nhất quán từ một prompt, duy trì tính nhất quán của nhân vật và đối tượng trong toàn bộ bộ ảnh.
- Tính chân thực và khả năng sử dụng: Kết quả trông tự nhiên hơn và sẵn sàng cho sản xuất, với ít tạo tác hơn, bộ biểu tượng tốt hơn và bố cục chuyên nghiệp.