Home/Models/Google/Nano Banana 2
G

Nano Banana 2

Đầu vào:$0.2/M
Đầu ra:$1.2/M
Tổng quan về khả năng cốt lõi: Độ phân giải: Lên đến 4K (4096×4096), tương đương với Pro. Tính nhất quán hình ảnh tham chiếu: Tối đa 14 hình ảnh tham chiếu (10 đối tượng + 4 nhân vật), duy trì tính nhất quán về phong cách/nhân vật. Tỷ lệ khung hình cực đoan: Bổ sung các tỷ lệ mới 1:4, 4:1, 1:8, 8:1, phù hợp cho hình ảnh dài, poster và banner. Kết xuất văn bản: Tạo văn bản nâng cao, phù hợp cho infographics và bố cục poster marketing. Tăng cường tìm kiếm: Tích hợp Google Search + Image Search. Lý giải nền tảng: Quy trình tư duy tích hợp; các prompt phức tạp được suy luận trước khi tạo.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Thông số kỹ thuật của Gemini 3.1 Flash Image Preview

Hạng mụcGemini 3.1 Flash Image Preview
Nhà cung cấpGoogle
Dòng mô hìnhGemini 3.1 (phân hạng Flash)
Trọng tâm chínhTạo đa phương thức nhanh với xem trước hình ảnh
Loại đầu vàoVăn bản, Hình ảnh
Loại đầu raVăn bản, Hình ảnh (tạo bản xem trước)
Cửa sổ ngữ cảnhTối đa 1M token (tiêu chuẩn phân hạng Flash của Gemini 3.x)
Phân hạng độ trễĐộ trễ thấp, thông lượng cao
Hỗ trợ streamingCó
Gọi công cụCó (khung công cụ Gemini API)
Phiên bản3.1

Nano Banana 2 là gì

Nano Banana 2 là biệt danh phổ biến do báo chí và cộng đồng nhà phát triển sử dụng cho mô hình Gemini-3.1-Flash-Image mới phát hành. Google định vị nó là động cơ hình ảnh thuộc phân hạng “Flash” mang lại độ trung thực thị giác gần mức Pro ở mức độ trễ và chi phí thấp hơn — phù hợp cho tạo nội dung khối lượng lớn, chỉnh sửa lặp nhanh, và quy trình công việc tích hợp sản phẩm trên các dịch vụ của Google. Nó kế thừa khả năng suy luận đa phương thức của Gemini 3.1 và bổ sung các năng lực tập trung vào hình ảnh (chữ rõ ràng trong ảnh, phối hợp nhiều ảnh, hỗ trợ tỉ lệ khung hình rộng, 4K gốc).

Tính năng chính

  • Tạo nhanh, đa độ phân giải: Tốc độ phân hạng Flash với các tùy chọn xuất 0.5K / 1K / 2K / 4K và các tỉ lệ khung hình cực đoan mới (1:4, 4:1, 1:8, 8:1).
  • Liên kết nền tảng web theo thời gian thực: Tích hợp kết quả tìm kiếm văn bản và hình ảnh để gắn nội dung tạo ra với thông tin web hiện thời khi bật “Thinking” hoặc liên kết nền tảng tìm kiếm. Hữu ích cho tài liệu tham khảo cập nhật và đồ họa thông tin mang tính chính xác.
  • Cải thiện hiển thị chữ: Hiển thị văn bản ngắn và chữ trong đồ họa (phông chữ, kích thước) tốt hơn các mô hình Flash trước đó; vẫn chưa hoàn hảo với đoạn dài/chữ nhỏ.
  • Chỉnh sửa đa đầu vào và quy trình đa lượt: Hỗ trợ mạnh mẽ việc kết hợp nhiều ảnh làm đầu vào và chỉnh sửa lặp qua nhiều lượt.

📊 Hiệu năng benchmark — Tạo và chỉnh sửa hình ảnh (điểm Elo)

Khả năngGemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
Văn bản thành hình ảnh — Ưu tiên tổng thể1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
Văn bản thành hình ảnh — Chất lượng thị giác1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
Văn bản thành hình ảnh — Đồ họa thông tin (Tính đúng sự thật)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
Chỉnh sửa — Tổng quát1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
Chỉnh sửa — Nhân vật1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
Chỉnh sửa — Sáng tạo1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
Chỉnh sửa — Đối tượng/Môi trường1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
Chỉnh sửa — Đa đầu vào1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
Chỉnh sửa — Phong cách hóa1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

Những điểm rút ra chính từ bảng benchmark này:

  • Trong các hạng mục tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh, Gemini 3.1 Flash Image liên tục dẫn đầu hoặc đạt điểm cao ngang mức cao nhất trong nhóm phân hạng Flash và nhiều mô hình hình ảnh cạnh tranh.
  • Mô hình thể hiện đặc biệt mạnh ở các benchmark Chất lượng thị giác và Đồ họa thông tin (Tính đúng sự thật) — cho thấy nó vượt trội không chỉ về thẩm mỹ mà còn trong việc hiển thị nội dung có cấu trúc chính xác.
  • Ở chỉnh sửa Đa đầu vào, Nano Banana 2 cũng cho thấy khả năng khái quát mạnh, với điểm số cao hơn thế hệ Flash trước.

Những đánh giá này được thực hiện thông qua so sánh Elo song song bởi con người trên một bộ benchmark đa dạng, phản ánh cả mức độ ưa thích và độ trung thực trên các tác vụ tạo/chỉnh sửa hình ảnh thường dùng.

Nano Banana 2 so với Nano Banana và Nano Banana Pro

Mô hìnhĐịnh vịBenchmark/ghi chú đại diện
Gemini 3.1 Flash Image (Nano Banana 2)Phân hạng Flash: tốc độ + chất lượng thị giác cao (2K–4K)Ưu tiên tổng thể 1079.0 ± 7.0; chất lượng thị giác 1140 ± 6.0 (GenAI-Bench nội bộ).
Gemini 2.5 Flash Image (Nano Banana)Bản phát hành Flash trước đó (độ trung thực thấp hơn)Điểm ưu tiên/chất lượng thị giác thấp hơn một chút so với 3.1.
Gemini 3 Pro Image (Nano Banana Pro)Phân hạng Pro: độ trung thực cảm nhận cao hơn cho tác vụ phức tạp, chi phí/độ trễ cao hơnCác đánh đổi khác nhau; một số chỉ số cho thấy xếp hạng tương đối khác biệt trong các tác vụ chuyên biệt.
GPT-Image 1.5 / các mô hình thương mại khácĐối thủ (mở/đóng)Trong các benchmark nội bộ của Google, GPT-Image và các mô hình khác đạt điểm thấp hơn Gemini 3.1 về chất lượng thị giác và ưu tiên tổng thể trong đánh giá đã báo cáo. So sánh độc lập từ bên thứ ba có thể khác nhau.

Khi nào nên chọn Flash Image Preview:

  • Xem trước hình ảnh theo thời gian thực trong ứng dụng
  • Tạo hình ảnh quy mô lớn nhạy về chi phí
  • Trợ lý thiết kế tương tác

Cách truy cập và tích hợp Nano Banana 2

Bước 1: Đăng ký khóa API

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa API thông tin truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API Nano Banana 2

Chọn endpoint “gemini-3.1-flash-image-preview8” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực của bạn từ tài khoản. Nơi gọi:Gemini tạo hình ảnh

Nano Banana 2 hỗ trợ chỉnh sửa hình ảnh, tạo hình ảnh và quy trình đa hình ảnh. Đối với chỉnh sửa hình ảnh, bạn cần tải lên URL của hình ảnh. Để biết thêm các tham số, vui lòng tham khảo tài liệu.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy kết quả đã tạo. Sau khi xử lý, API sẽ trả về trạng thái tác vụ và dữ liệu đầu ra. Bạn có thể tải trực tiếp hình ảnh về máy cục bộ trong playground (thường ở định dạng PNG). Một URL hình ảnh được tạo trong quá trình API; vui lòng tải xuống kịp thời.

Câu hỏi thường gặp

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 là mô hình tạo và chỉnh sửa hình ảnh AI mới nhất của Google, được xây dựng trên công nghệ hình ảnh Gemini Flash để mang lại khả năng tạo hình ảnh nhanh, chất lượng cao và tuân thủ hướng dẫn chính xác trên cả đầu vào văn bản và hình ảnh.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 về bản chất là thương hiệu hướng tới người dùng cho mô hình Gemini 3.1 Flash Image của Google, kết hợp các khả năng tiên tiến từ những phiên bản Nano Banana trước đó với tốc độ của các mô hình Flash.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 mang đến tốc độ tạo nhanh hơn, chi tiết sắc nét hơn, khả năng tuân thủ hướng dẫn tốt hơn, cải thiện kết xuất văn bản/dịch bản địa hóa và khả năng kiểm soát sáng tạo rộng hơn, đồng thời đưa nhiều tính năng cấp độ Pro xuống mức cơ bản.

What kinds of images and resolutions can Nano Banana 2 generate?

Mô hình hỗ trợ đầu ra linh hoạt với nhiều tỷ lệ khung hình và độ phân giải lên đến 4K, phù hợp cho mạng xã hội, quảng cáo, màn hình hiển thị và nội dung chuyên nghiệp.

Can Nano Banana 2 maintain consistency in complex compositions?

Có — nó duy trì tính nhất quán giữa nhiều chủ thể và đối tượng (ví dụ, lên đến năm nhân vật và 14 đối tượng trong một quy trình với một prompt), giúp ích cho các cảnh kể chuyện và các tác vụ kiểu storyboard.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

Rất phù hợp cho tạo và chỉnh sửa hình ảnh cấp độ chuyên nghiệp, đồ họa thông tin, tính nhất quán giữa nhiều hình ảnh, kết xuất văn bản và đầu ra đa ngôn ngữ bản địa hóa, đặc biệt khi quy trình cần kiểm soát chính xác và lặp lại nhiều lần.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 tích hợp kiến thức thế giới thực và tích hợp tìm kiếm hình ảnh để giúp tạo ra các chủ thể chính xác hơn, đồ họa thông tin và hình ảnh nhận biết vị trí.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Có — nó có thể tạo và kết xuất văn bản rõ ràng trong hình ảnh, nhưng văn bản cực nhỏ hoặc nhiều đoạn dày đặc đôi khi vẫn là một thách thức.

Tính năng cho Nano Banana 2

Khám phá các tính năng chính của Nano Banana 2, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho Nano Banana 2

Khám phá mức giá cạnh tranh cho Nano Banana 2, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Nano Banana 2 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.2/M
Đầu ra:$1.2/M
Đầu vào:$0.25/M
Đầu ra:$1.5/M
-20%

Mã mẫu và API cho Nano Banana 2

Truy cập mã mẫu toàn diện và tài nguyên API cho Nano Banana 2 để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của Nano Banana 2 trong các dự án của mình.
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Các phiên bản của Nano Banana 2

Lý do Nano Banana 2 có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
Model idMô tảKhả dụngYêu cầu
gemini-3.1-flash-imageĐược khuyến nghị, trỏ đến mô hình mới nhất✅Gemini tạo hình ảnh
gemini-3.1-flash-image-previewBản xem trước chính thức✅Gemini tạo hình ảnh

Thêm mô hình