Thông số kỹ thuật của Gemini 3.1 Flash Image Preview
| Hạng mục | Gemini 3.1 Flash Image Preview |
|---|---|
| Nhà cung cấp | |
| Dòng mô hình | Gemini 3.1 (phân hạng Flash) |
| Trọng tâm chính | Tạo đa phương thức nhanh với xem trước hình ảnh |
| Loại đầu vào | Văn bản, Hình ảnh |
| Loại đầu ra | Văn bản, Hình ảnh (tạo bản xem trước) |
| Cửa sổ ngữ cảnh | Tối đa 1M token (tiêu chuẩn phân hạng Flash của Gemini 3.x) |
| Phân hạng độ trễ | Độ trễ thấp, thông lượng cao |
| Hỗ trợ streaming | Có |
| Gọi công cụ | Có (khung công cụ Gemini API) |
| Phiên bản | 3.1 |
Nano Banana 2 là gì
Nano Banana 2 là biệt danh phổ biến do báo chí và cộng đồng nhà phát triển sử dụng cho mô hình Gemini-3.1-Flash-Image mới phát hành. Google định vị nó là động cơ hình ảnh thuộc phân hạng “Flash” mang lại độ trung thực thị giác gần mức Pro ở mức độ trễ và chi phí thấp hơn — phù hợp cho tạo nội dung khối lượng lớn, chỉnh sửa lặp nhanh, và quy trình công việc tích hợp sản phẩm trên các dịch vụ của Google. Nó kế thừa khả năng suy luận đa phương thức của Gemini 3.1 và bổ sung các năng lực tập trung vào hình ảnh (chữ rõ ràng trong ảnh, phối hợp nhiều ảnh, hỗ trợ tỉ lệ khung hình rộng, 4K gốc).
Tính năng chính
- Tạo nhanh, đa độ phân giải: Tốc độ phân hạng Flash với các tùy chọn xuất 0.5K / 1K / 2K / 4K và các tỉ lệ khung hình cực đoan mới (1:4, 4:1, 1:8, 8:1).
- Liên kết nền tảng web theo thời gian thực: Tích hợp kết quả tìm kiếm văn bản và hình ảnh để gắn nội dung tạo ra với thông tin web hiện thời khi bật “Thinking” hoặc liên kết nền tảng tìm kiếm. Hữu ích cho tài liệu tham khảo cập nhật và đồ họa thông tin mang tính chính xác.
- Cải thiện hiển thị chữ: Hiển thị văn bản ngắn và chữ trong đồ họa (phông chữ, kích thước) tốt hơn các mô hình Flash trước đó; vẫn chưa hoàn hảo với đoạn dài/chữ nhỏ.
- Chỉnh sửa đa đầu vào và quy trình đa lượt: Hỗ trợ mạnh mẽ việc kết hợp nhiều ảnh làm đầu vào và chỉnh sửa lặp qua nhiều lượt.
📊 Hiệu năng benchmark — Tạo và chỉnh sửa hình ảnh (điểm Elo)
| Khả năng | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Văn bản thành hình ảnh — Ưu tiên tổng thể | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Văn bản thành hình ảnh — Chất lượng thị giác | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Văn bản thành hình ảnh — Đồ họa thông tin (Tính đúng sự thật) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Chỉnh sửa — Tổng quát | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Chỉnh sửa — Nhân vật | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Chỉnh sửa — Sáng tạo | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Chỉnh sửa — Đối tượng/Môi trường | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Chỉnh sửa — Đa đầu vào | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Chỉnh sửa — Phong cách hóa | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Những điểm rút ra chính từ bảng benchmark này:
- Trong các hạng mục tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh, Gemini 3.1 Flash Image liên tục dẫn đầu hoặc đạt điểm cao ngang mức cao nhất trong nhóm phân hạng Flash và nhiều mô hình hình ảnh cạnh tranh.
- Mô hình thể hiện đặc biệt mạnh ở các benchmark Chất lượng thị giác và Đồ họa thông tin (Tính đúng sự thật) — cho thấy nó vượt trội không chỉ về thẩm mỹ mà còn trong việc hiển thị nội dung có cấu trúc chính xác.
- Ở chỉnh sửa Đa đầu vào, Nano Banana 2 cũng cho thấy khả năng khái quát mạnh, với điểm số cao hơn thế hệ Flash trước.
Những đánh giá này được thực hiện thông qua so sánh Elo song song bởi con người trên một bộ benchmark đa dạng, phản ánh cả mức độ ưa thích và độ trung thực trên các tác vụ tạo/chỉnh sửa hình ảnh thường dùng.
Nano Banana 2 so với Nano Banana và Nano Banana Pro
| Mô hình | Định vị | Benchmark/ghi chú đại diện |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Phân hạng Flash: tốc độ + chất lượng thị giác cao (2K–4K) | Ưu tiên tổng thể 1079.0 ± 7.0; chất lượng thị giác 1140 ± 6.0 (GenAI-Bench nội bộ). |
| Gemini 2.5 Flash Image (Nano Banana) | Bản phát hành Flash trước đó (độ trung thực thấp hơn) | Điểm ưu tiên/chất lượng thị giác thấp hơn một chút so với 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Phân hạng Pro: độ trung thực cảm nhận cao hơn cho tác vụ phức tạp, chi phí/độ trễ cao hơn | Các đánh đổi khác nhau; một số chỉ số cho thấy xếp hạng tương đối khác biệt trong các tác vụ chuyên biệt. |
| GPT-Image 1.5 / các mô hình thương mại khác | Đối thủ (mở/đóng) | Trong các benchmark nội bộ của Google, GPT-Image và các mô hình khác đạt điểm thấp hơn Gemini 3.1 về chất lượng thị giác và ưu tiên tổng thể trong đánh giá đã báo cáo. So sánh độc lập từ bên thứ ba có thể khác nhau. |
Khi nào nên chọn Flash Image Preview:
- Xem trước hình ảnh theo thời gian thực trong ứng dụng
- Tạo hình ảnh quy mô lớn nhạy về chi phí
- Trợ lý thiết kế tương tác
Cách truy cập và tích hợp Nano Banana 2
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa API thông tin truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API Nano Banana 2
Chọn endpoint “gemini-3.1-flash-image-preview8” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực của bạn từ tài khoản. Nơi gọi:Gemini tạo hình ảnh
Nano Banana 2 hỗ trợ chỉnh sửa hình ảnh, tạo hình ảnh và quy trình đa hình ảnh. Đối với chỉnh sửa hình ảnh, bạn cần tải lên URL của hình ảnh. Để biết thêm các tham số, vui lòng tham khảo tài liệu.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy kết quả đã tạo. Sau khi xử lý, API sẽ trả về trạng thái tác vụ và dữ liệu đầu ra. Bạn có thể tải trực tiếp hình ảnh về máy cục bộ trong playground (thường ở định dạng PNG). Một URL hình ảnh được tạo trong quá trình API; vui lòng tải xuống kịp thời.