Tổng quan về Nano Banana 2 Lite API
Nano Banana 2 Lite API, tên chính thức là gemini-3.1-flash-lite-image, là mô hình hình ảnh Gemini 3.1 tập trung hiệu năng của Google dành cho tạo và chỉnh sửa hình ảnh khối lượng lớn. Google cũng gọi nó là Gemini 3.1 Flash Lite Image. Trên CometAPI, nhà phát triển có thể truy cập mô hình qua tuyến generateContent gốc của Gemini, phù hợp cho bản nháp hình ảnh 1K nhanh, chỉnh sửa ảnh đơn giản, công cụ sáng tạo tương tác, hình thu nhỏ, tài sản mạng xã hội và các quy trình sản xuất nơi tốc độ và kiểm soát chi phí quan trọng hơn độ phân giải tối đa.
Thông số kỹ thuật
| Hạng mục | Thông số |
|---|---|
| Tên mô hình | Nano Banana 2 Lite / Gemini 3.1 Flash Lite Image |
| API model ID | gemini-3.1-flash-lite-image |
| Mã mô hình trên CometAPI | gemini-3-1-flash-lite-image |
| Nhà cung cấp | |
| Loại mô hình | Tạo và chỉnh sửa hình ảnh |
| Tính năng trong danh mục CometAPI | text-to-image |
| Kiểu đầu vào | Văn bản và hình ảnh |
| Kiểu đầu ra | Hình ảnh và văn bản |
| Endpoint trên CometAPI | POST /v1beta/models/{model}:generateContent |
| Stable model ID | gemini-3.1-flash-lite-image |
| Giới hạn token đầu vào | 65,536 tokens |
| Giới hạn token đầu ra | 4,096 tokens |
| Độ phân giải đầu ra | 1K / 1024px chỉ |
| Tỉ lệ khung hình hỗ trợ | 14 tỉ lệ bao gồm 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| Suy luận | Được hỗ trợ; tối thiểu và cao |
Nano Banana 2 Lite là gì?
Nano Banana 2 Lite là thành viên tập trung tốc độ và hiệu năng trong gia đình mô hình hình ảnh Gemini của Google. Trang mô hình của Google mô tả đây là chuyên gia hiệu năng cho tạo và chỉnh sửa hình ảnh, được thiết kế cho độ trễ siêu thấp và chi phí hiệu quả.
Sự đánh đổi là có chủ đích: Nano Banana 2 Lite nhắm tới đầu ra 1K và tương tác khối lượng lớn thay vì độ trung thực tối đa. Google cho biết đầu ra 2K và 4K không được hỗ trợ trên bản Lite này, và hướng dẫn tạo ảnh cho biết nó không tối ưu cho nhiều đầu vào tham chiếu hoặc chỉnh sửa tuần tự nhiều lượt. Điều đó khiến nó phù hợp mặc định cho bản nháp nhanh và chỉnh sửa nhẹ, trong khi Gemini 3.1 Flash Image và Nano Banana Pro phù hợp hơn cho công việc sản xuất độ phân giải cao hoặc nhiều tham chiếu.
Các tính năng chính của Nano Banana 2 Lite API
1. Độ trễ siêu thấp cho quy trình hình ảnh tương tác
Google định vị Nano Banana 2 Lite là chuyên gia hiệu năng của gia đình Gemini. Thẻ mô hình chính thức cho biết mục tiêu là độ trễ đầu-cuối dưới 2 giây, trong khi bài viết ra mắt của Google nêu thời gian xuất ảnh từ văn bản khoảng 4 giây cho việc phác thảo nhanh thực tế. Trong sản xuất, độ trễ thực tế sẽ phụ thuộc vào độ phức tạp prompt, kích thước ảnh đầu vào, đường mạng, kiểu phản hồi và điều kiện định tuyến của CometAPI, nhưng mô hình rõ ràng được thiết kế cho vòng phản hồi nhanh thay vì kết xuất ngoại tuyến độ phân giải tối đa.
Điều này đặc biệt hữu ích cho các nhà xây dựng trải nghiệm tương tác: giao diện ứng dụng tạo hình ảnh khi người dùng nhập, hệ thống hình thu nhỏ khối lượng lớn, xem trước game hoặc avatar, khám phá biến thể quảng cáo, tạo ảnh tạm cho ecommerce và công cụ sáng tạo nơi người dùng có thể yêu cầu hàng chục lặp nhỏ trước khi chốt hướng cuối cùng.
2. Sinh ảnh từ văn bản và từ ảnh sang ảnh nguyên bản
Nano Banana 2 Lite hỗ trợ cả đầu vào văn bản và ảnh, và có thể trả về cả đầu ra ảnh và văn bản. Thông qua tuyến ảnh của Gemini trên CometAPI, nhà phát triển có thể gửi prompt văn bản để tạo ảnh từ văn bản nguyên bản, hoặc kết hợp ảnh đầu vào với hướng dẫn văn bản để chỉnh sửa ảnh.
Vì dùng luồng xử lý ảnh gốc của Gemini, Nano Banana 2 Lite không bị giới hạn ở mô hình “nhập prompt, xuất ảnh” đơn giản. Nó có thể đọc ngữ cảnh thị giác của người dùng, áp dụng chỉnh sửa cục bộ, tạo ảnh mới và tùy chọn kèm văn bản trong phản hồi. Đây là hình thức phù hợp cho công cụ mockup sản phẩm, thay nền, chuyển phong cách nhanh, biến thể chiến dịch bản địa hóa và ảnh xem trước trong ứng dụng tiêu dùng.
3. Chỉnh sửa ảnh cục bộ nhiều lượt nhanh
Thẻ mô hình của Google liệt kê các chỉnh sửa cục bộ nhiều lượt nhanh là năng lực chủ chốt, bao gồm ví dụ như đổi màu, tạo nhãn dán và điều chỉnh nền. Trong thực tế, người dùng có thể yêu cầu một ảnh ban đầu, sau đó tiếp tục với hướng dẫn tiếp theo như “làm cho áo khoác màu đỏ”, “biến nó thành nhãn dán” hoặc “thay nền bằng bức tường studio sạch”.
Giới hạn quan trọng: hướng dẫn tạo ảnh của Google cho biết Nano Banana 2 Lite không tối ưu cho nhiều đầu vào tham chiếu hoặc chỉnh sửa tuần tự nhiều lượt. Hãy dùng Lite cho chỉnh sửa cục bộ nhanh và khám phá hội thoại; chuyển sang Nano Banana 2 hoặc Nano Banana Pro khi cần xử lý tham chiếu nặng, chuỗi chỉnh sửa dài hơn hoặc kiểm soát bố cục chuyên nghiệp.
4. Bám sát prompt và căn chỉnh nhân vật mạnh mẽ
Google cho biết Nano Banana 2 Lite giữ mức kiểm soát và độ chính xác như kỳ vọng của Nano Banana trong khi tăng tốc trải nghiệm. Tài liệu chính thức nêu bật khả năng bám prompt đáng tin cậy, độ nhất quán nhân vật mạnh và căn chỉnh nhân vật cao ngang chuẩn Nano Banana gốc.
Điều này khiến mô hình hữu dụng hơn một bộ tạo ảnh nhanh phổ thông. Với khám phá sáng tạo lặp lại, mô hình phải giữ được chủ thể, định hướng màu, dáng, bối cảnh, dấu hiệu thương hiệu và danh tính nhân vật xuyên suốt các biến thể. Nano Banana 2 Lite được thiết kế cho bài toán “lặp nhanh mà không đánh mất ý tưởng”.
5. Kết xuất văn bản trong ảnh được cải thiện
Bài viết ra mắt của Google cho biết Nano Banana 2 Lite vẫn giữ khả năng kết xuất văn bản trong ảnh rõ ràng dù ưu tiên tốc độ. Điều này quan trọng cho hình thu nhỏ, poster đơn giản, concept UI, nhãn, nhãn dán và đồ họa marketing nhẹ nơi cần hiển thị từ hoặc cụm ngắn trong ảnh tạo ra.
Với infographic nhiều chữ, bố cục đa ngôn ngữ, trang tạp chí, bao bì sản phẩm hoặc kiểu chữ tinh xảo, Nano Banana 2 và Nano Banana Pro là lựa chọn tốt hơn. Hướng dẫn tạo ảnh của Google định vị Nano Banana 2 là mô hình tổng quát với kết xuất văn bản đáng tin cậy, trong khi Nano Banana Pro là lựa chọn chuyên nghiệp cho văn bản chính xác và bố cục phức tạp.
6. Đầu ra 1K với hỗ trợ tỉ lệ khung hình đa dạng
Nano Banana 2 Lite được tối ưu cho đầu ra 1K, thẻ mô hình của Google liệt kê 1024px / 1K là kích thước ảnh hỗ trợ và lưu ý rằng 2K và 4K không được hỗ trợ. Nó hỗ trợ các tỉ lệ phổ biến gồm vuông, dọc, ngang, định dạng mạng xã hội dọc và siêu rộng.
Trong sản xuất, hãy đặt rõ imageConfig.aspectRatio và imageConfig.imageSize, và dùng 1K viết hoa hoặc giá trị 1024px được hỗ trợ. Nếu quy trình của bạn cần 2K, 4K, bản xem trước tiện ích 0.5K, hoặc đầu ra in ấn/thiết kế độ trung thực cao, hãy dùng Nano Banana 2 hoặc Nano Banana Pro.
Hiệu năng benchmark của Nano Banana 2 Lite
Theo bảng xếp hạng công khai của Arena.ai ngày 29 tháng 6, 2026, gemini-3.1-flash-lite-image là mô hình hiệu năng xếp hạng cao chứ không chỉ là “bản nháp rẻ”: nó đạt điểm gần các mô hình hình ảnh Gemini nặng hơn trong sinh ảnh và vẫn cạnh tranh ở chỉnh sửa ảnh đơn lẻ trong khi ưu tiên độ trễ thấp hơn nhiều.
| Benchmark | Điểm Nano Banana 2 Lite | Tín hiệu xếp hạng Arena.ai | Lượt bình chọn | Ý nghĩa |
|---|---|---|---|---|
| Text-to-Image Arena, Tổng thể | 1251 +/- 8 | Hạng 5 trên 70 mô hình | 5,462 | Chất lượng sinh ảnh mạnh đối với một mô hình Lite, chỉ dưới mai-image-2.5 và Nano Banana 2, và trên bản xem trước 2K của Nano Banana Pro ở thời điểm chụp này |
| Image Edit Arena, Chỉnh sửa ảnh đơn | 1308 +/- 7 | Hạng 15 trên 49 mô hình | 9,320 | Chất lượng chỉnh sửa cạnh tranh, sau các mô hình hình ảnh đầu bảng nhưng vượt nhiều trình chỉnh sửa ảnh phổ thông |
Cách lựa chọn: Nano Banana 2 Lite vs Nano Banana 2 vs Nano Banana Pro
Gia đình mô hình hình ảnh Nano Banana của Google được phân tầng theo tốc độ, chất lượng và khả năng kiểm soát. Nano Banana 2 Lite là mô hình nhanh, hiệu quả cho tạo ảnh 1K khối lượng lớn. Nano Banana 2 là “máy cày” tổng quát cho tạo và chỉnh sửa ảnh chất lượng cao với xử lý tham chiếu mạnh hơn và đầu ra tới 4K. Nano Banana Pro là mô hình cao cấp cho thiết kế phức tạp, độ chính xác thương hiệu, bản địa hóa nâng cao và kiểm soát sáng tạo chính xác.
Bảng xếp hạng sinh ảnh từ văn bản đặt gemini-3.1-flash-lite-image (nano-banana-2-lite) gần với nhiều đối thủ cao cấp: gemini-3.1-flash-image-preview (nano-banana-2) đạt 1270 +/- 4, mai-image-2.5 đạt 1257 +/- 5, gemini-3-pro-image-preview-2k (nano-banana-pro) đạt 1245 +/- 4, và gpt-image-1.5-high-fidelity đạt 1241 +/- 3. Bảng xếp hạng chỉnh sửa ảnh khắt khe hơn với Lite: gpt-image-2 (medium) dẫn đầu với 1464 +/- 4, trong khi 1308 +/- 7 của Nano Banana 2 Lite đặt nó dưới nhóm flagship nhưng vẫn ở nhóm trên cạnh tranh.
| Mô hình | Nhà cung cấp | Khối lượng công việc phù hợp nhất | Tín hiệu benchmark công khai |
|---|---|---|---|
| Nano Banana 2 Lite (gemini-3.1-flash-lite-image) | Tạo ảnh 1K nhanh, chỉnh sửa nhẹ, bản nháp khối lượng lớn, trải nghiệm sản phẩm tương tác | 1251 +/- 8 trên Arena.ai Text-to-Image Overall; 1308 +/- 7 trên Arena.ai Single-Image Edit | |
| Nano Banana 2 / Gemini 3.1 Flash Image | Tạo ảnh Gemini 3.1 chất lượng cao hơn, xử lý đa tham chiếu tốt hơn, quy trình 2K/4K | 1270 +/- 4 trên Arena.ai Text-to-Image Overall; 1387 +/- 4 trên Arena.ai Single-Image Edit | |
| Nano Banana Pro / Gemini 3 Pro Image | Thành phần phức tạp hơn, ngữ cảnh phong phú hơn và công việc sản xuất độ phân giải cao | 1245 +/- 4 cho bản xem trước 2K trên Arena.ai Text-to-Image Overall; 1388 +/- 3 cho bản xem trước 2K trên Arena.ai Single-Image Edit | |
| GPT Image 2 | OpenAI | Sinh và chỉnh sửa cao cấp nơi chất lượng benchmark tối đa quan trọng hơn độ trễ cấp Lite | Dẫn đầu các ảnh chụp Arena.ai được dẫn chiếu với 1387 +/- 5 trong Text-to-Image và 1464 +/- 4 trong Single-Image Edit |
Chọn Nano Banana 2 Lite khi trải nghiệm sản phẩm phụ thuộc vào tốc độ, kiểm soát chi phí và lặp lại thường xuyên. Đây là lựa chọn tốt nhất cho UX gần thời gian thực, tạo bản nháp và chỉnh sửa nhẹ ở 1K.
Chọn Nano Banana 2 khi bạn cần mặc định an toàn về chất lượng ảnh, đầu ra 4K, nhiều tham chiếu, kết xuất văn bản tốt hơn và cân bằng chất lượng-độ trễ hợp lý. Đây là lựa chọn mục đích chung tốt nhất cho hầu hết quy trình sinh ảnh sản xuất.
Chọn Nano Banana Pro khi tác vụ nghiêng về sản xuất thiết kế hơn là tạo nhanh: quảng cáo thương hiệu, mockup sản phẩm, bố cục nhiều thành phần, bản địa hóa, kiểu chữ tinh xảo, sơ đồ phức tạp hoặc tài sản cần kiến thức thế giới và kiểm soát sáng tạo ở mức cao nhất.
Cách sử dụng Nano Banana 2 Lite API trên CometAPI
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng CometAPI, hãy đăng ký trước, sau đó mở trang token bảng điều khiển CometAPI. Trong trung tâm cá nhân, nhấp Add Token dưới quản lý token API, tạo thông tin xác thực truy cập và sao chép khóa token theo định dạng sk-xxxxx.
Giữ khóa API này ở chế độ riêng tư và sử dụng từ dịch vụ backend hoặc biến môi trường cục bộ của bạn. Trong các ví dụ bên dưới, thay thế <YOUR_API_KEY> hoặc $COMETAPI_KEY bằng khóa CometAPI thực tế từ tài khoản của bạn.
Bước 2: Gửi yêu cầu tới Nano Banana 2 Lite API
Chọn endpoint mô hình gemini-3.1-flash-lite-image cho Nano Banana 2 Lite. Yêu cầu được gửi qua tuyến ảnh của Gemini trên CometAPI:
POST https://api.cometapi.com/v1beta/models/gemini-3.1-flash-lite-image:generateContent
Sử dụng phương thức yêu cầu và nội dung yêu cầu từ tài liệu hình ảnh Gemini của CometAPI. Nơi gọi: Gemini tạo ảnh. Cùng một tuyến hỗ trợ sinh ảnh từ văn bản, chỉnh sửa ảnh và quy trình nhiều ảnh, nhưng bản thân Nano Banana 2 Lite được tối ưu cho đầu ra 1K nhanh thay vì 2K/4K hoặc chuỗi chỉnh sửa phức tạp dài.
Với sinh ảnh từ văn bản, gửi prompt văn bản trong contents.parts.text và đặt generationConfig.responseModalities bao gồm IMAGE. Với chỉnh sửa ảnh, cung cấp ảnh đầu vào theo hướng dẫn của CometAPI, ví dụ truyền ảnh cục bộ qua Google Gen AI SDK hoặc dữ liệu ảnh thô theo định dạng Gemini đã ghi tài liệu, rồi thêm hướng dẫn chỉnh sửa dạng văn bản. Với quy trình nhiều ảnh, tải lên hoặc chuẩn bị ảnh nguồn trước và làm theo tài liệu hiện hành về đầu vào ảnh được hỗ trợ và giới hạn đặc thù mô hình.
Bước 3: Nhận và xác minh kết quả
Xử lý phản hồi API để lấy ảnh đã tạo. Phản hồi ảnh của Gemini có thể bao gồm phần văn bản, phần ảnh cuối và đôi khi phần ảnh trung gian được đánh dấu thought: true. Không lưu ảnh đầu tiên một cách mù quáng; bỏ qua các phần thought: true và lưu phần ảnh còn lại cuối cùng nơi có inlineData và thought không phải true.
Trong playground của CometAPI, bạn có thể tải xuống trực tiếp ảnh đã tạo, thường ở định dạng PNG. Trong quy trình API, giải mã và lưu trữ inlineData ảnh trả về hoặc tải xuống URL kết quả được tạo nếu quy trình CometAPI bạn chọn trả về. Hãy tải xuống hoặc lưu trữ tài sản đã tạo kịp thời, sau đó xác minh ảnh cuối cùng về độ phân giải, mức bám prompt, hiện tượng tạo tác, yêu cầu an toàn và liệu đó có phải ảnh đầu ra cuối cùng chứ không phải ảnh “đang suy nghĩ”.
Vì sao sử dụng CometAPI cho Nano Banana 2 Lite?
CometAPI hữu ích khi đội ngũ muốn một tài khoản và một lớp định tuyến cho nhiều mô hình hình ảnh. Với Nano Banana 2 Lite trên CometAPI, các đội có thể chạy sinh ảnh Gemini 1K nhanh, so sánh đầu ra với Gemini 3.1 Flash Image, Nano Banana Pro, Imagen, Flux, các tuyến kiểu Midjourney và những mô hình hình ảnh khác, rồi định tuyến công việc theo hồ sơ chất lượng, độ trễ và chi phí.
Danh mục mô hình của CometAPI cũng hiển thị ID mô hình hiện tại, nhà cung cấp, cờ tính năng, tình trạng sẵn sàng và đường dẫn endpoint. Điều đó giảm mơ hồ tích hợp cho ứng dụng sản xuất cần chuyển đổi mô hình, phương án dự phòng, theo dõi sử dụng và quản lý thông tin xác thực nhất quán.