Thông số kỹ thuật của Gemini 3.1 Flash Image Preview
| Mục | Gemini 3.1 Flash Image Preview |
|---|---|
| Nhà cung cấp | |
| Dòng mô hình | Gemini 3.1 (tầng Flash) |
| Trọng tâm chính | Tạo đa phương thức nhanh với xem trước hình ảnh |
| Loại đầu vào | Văn bản, Hình ảnh |
| Loại đầu ra | Văn bản, Hình ảnh (tạo xem trước) |
| Cửa sổ ngữ cảnh | Tối đa 1M token (tiêu chuẩn tầng Flash Gemini 3.x) |
| Tầng độ trễ | Độ trễ thấp, thông lượng cao |
| Hỗ trợ streaming | Có |
| Gọi công cụ | Có (khung công cụ Gemini API) |
| Phiên bản | 3.1 |
Nano Banana 2 là gì
Nano Banana 2 là biệt danh phổ biến do báo chí và cộng đồng nhà phát triển dùng để gọi mô hình Gemini-3.1-Flash-Image mới phát hành. Google định vị đây là động cơ hình ảnh thuộc “tầng Flash” mang lại độ trung thực thị giác gần mức Pro với độ trễ và chi phí thấp hơn nhiều — phù hợp cho tạo nội dung khối lượng lớn, chỉnh sửa lặp nhanh và các quy trình sản phẩm tích hợp trong các dịch vụ của Google. Nó kế thừa khả năng suy luận đa phương thức của Gemini 3.1 và bổ sung các khả năng tập trung vào hình ảnh (chữ trong ảnh dễ đọc, phối ghép đa ảnh, hỗ trợ tỷ lệ khung hình rộng, 4K gốc).
Tính năng chính
- Tạo tốc độ cao, đa độ phân giải: Tốc độ tầng Flash với tùy chọn đầu ra 0.5K / 1K / 2K / 4K và các tỷ lệ cực đoan mới (1:4, 4:1, 1:8, 8:1).
- Neo thông tin web theo thời gian thực: Tích hợp kết quả tìm kiếm văn bản và hình ảnh để neo nội dung tạo ra vào thông tin web hiện thời khi bật “Thinking” hoặc neo dựa trên tìm kiếm. Hữu ích cho tham chiếu cập nhật và đồ họa thông tin dựa trên sự thật.
- Cải thiện hiển thị chữ: Kết xuất chữ ngắn và đồ họa chữ (phông, kích cỡ) tốt hơn so với các mô hình Flash trước đó; vẫn chưa hoàn hảo với đoạn dài/chữ nhỏ.
- Chỉnh sửa đa đầu vào và quy trình đa lượt: Hỗ trợ mạnh việc kết hợp nhiều ảnh làm đầu vào và các lần chỉnh sửa lặp qua nhiều lượt.
📊 Hiệu năng Benchmark — Tạo & Chỉnh sửa Hình ảnh (điểm Elo)
| Năng lực | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Văn bản → Ảnh — Ưu tiên tổng thể | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Văn bản → Ảnh — Chất lượng thị giác | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Văn bản → Ảnh — Đồ họa thông tin (tính xác thực) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Chỉnh sửa — Tổng quát | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Chỉnh sửa — Nhân vật | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Chỉnh sửa — Sáng tạo | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Chỉnh sửa — Đối tượng/Môi trường | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Chỉnh sửa — Đa đầu vào | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Chỉnh sửa — Phong cách hóa | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Điểm chính rút ra từ bảng benchmark này:
- Trong các hạng mục tạo ảnh từ văn bản và chỉnh sửa ảnh, Gemini 3.1 Flash Image liên tục dẫn đầu hoặc ngang bằng điểm cao nhất trong nhóm tầng Flash và nhiều mô hình ảnh cạnh tranh khác.
- Mô hình thể hiện đặc biệt mạnh ở các benchmark Chất lượng thị giác và Đồ họa thông tin (tính xác thực) — cho thấy nó vượt trội không chỉ về thẩm mỹ mà còn trong việc kết xuất nội dung có cấu trúc chính xác.
- Ở hạng mục chỉnh sửa đa đầu vào, Nano Banana 2 cũng cho thấy khả năng khái quát mạnh mẽ, với điểm số cao hơn thế hệ Flash trước.
Các đánh giá này được thực hiện thông qua so sánh Elo song song do con người trên một bộ benchmark đa dạng, phản ánh cả mức độ ưa thích và độ trung thực trong các tác vụ tạo/chỉnh sửa ảnh thường dùng.
Nano Banana 2 so với Nano Banana và Nano Banana Pro
| Mô hình | Định vị | Benchmark/ghi chú tiêu biểu |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Tầng Flash: tốc độ + chất lượng thị giác cao (2K–4K) | Ưu tiên tổng thể 1079.0 ± 7.0; chất lượng thị giác 1140 ± 6.0 (GenAI-Bench nội bộ). |
| Gemini 2.5 Flash Image (Nano Banana) | Bản phát hành Flash trước (độ trung thực thấp hơn) | Điểm ưu tiên/chất lượng thị giác thấp hơn một chút so với 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Tầng Pro: độ trung thực cảm nhận cao hơn cho tác vụ phức tạp, chi phí/độ trễ cao hơn | Thỏa hiệp khác nhau; một số chỉ số cho thấy xếp hạng tương đối khác trong các tác vụ chuyên biệt. |
| GPT-Image 1.5 / các mô hình thương mại khác | Đối thủ (mã nguồn mở/đóng) | Trong benchmark nội bộ của Google, GPT-Image và các mô hình khác có điểm thấp hơn Gemini 3.1 về chất lượng thị giác và ưu tiên tổng thể trong đánh giá được báo cáo. So sánh độc lập từ bên thứ ba có thể khác nhau. |
Khi nào nên chọn Flash Image Preview:
- Xem trước hình ảnh theo thời gian thực trong ứng dụng
- Tạo ảnh quy mô lớn nhạy chi phí
- Trợ lý thiết kế tương tác
Cách truy cập và tích hợp Nano Banana 2
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa API (thông tin xác thực truy cập) của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu đến API Nano Banana 2
Chọn endpoint “gemini-3.1-flash-image-preview8” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp Apifox để bạn thử nghiệm. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực của bạn từ tài khoản. Nơi gọi: Gemini tạo ảnh
Nano Banana 2 hỗ trợ chỉnh sửa ảnh, tạo ảnh và quy trình đa ảnh. Đối với chỉnh sửa ảnh, bạn cần tải lên URL ảnh. Với các tham số khác, vui lòng tham khảo tài liệu.
Bước 3: Nhận và xác minh kết quả
Xử lý phản hồi API để lấy kết quả tạo ra. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra. Bạn có thể tải trực tiếp ảnh về máy cục bộ trong playground (thường ở định dạng PNG). Một URL ảnh được tạo trong quá trình API; vui lòng tải xuống kịp thời.



