Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

อินพุต:$1.5616/M
เอาต์พุต:$9.3696/M
Nano Banana Pro เป็นโมเดล AI สำหรับการช่วยงานแบบอเนกประสงค์ในเวิร์กโฟลว์ที่เน้นข้อความ เหมาะกับการพรอมต์แบบคำสั่งเพื่อสร้าง แปลง และวิเคราะห์เนื้อหาที่สามารถควบคุมโครงสร้างได้ การใช้งานทั่วไปได้แก่ ผู้ช่วยสนทนา การสรุปเอกสาร การถาม-ตอบเชิงความรู้ และการทำเวิร์กโฟลว์ให้เป็นอัตโนมัติ รายละเอียดทางเทคนิคที่เปิดเผยต่อสาธารณะมีจำกัด; การผสานรวมสอดคล้องกับรูปแบบทั่วไปของผู้ช่วย AI เช่น ผลลัพธ์แบบมีโครงสร้าง พรอมต์ที่เสริมด้วยการค้นคืนข้อมูล และการเรียกใช้เครื่องมือหรือฟังก์ชัน
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API
เวอร์ชัน

คุณสมบัติพื้นฐาน

  • ข้อความ → ภาพ: การสร้างตามพรอมป์แบบเต็มรูปแบบโดยยึดตามพรอมป์อย่างเคร่งครัด
  • ภาพ → ภาพ (แก้ไข): การแก้ไขแบบละเอียดและตรงจุด พร้อมรักษาความสม่ำเสมอของตัวแบบ/ตัวละครตลอดหลายครั้งของการแก้ไข
  • ความละเอียดผลลัพธ์สูงสุด: สูงสุด 4K (ตัวอย่างและขนาดพิกเซลที่รองรับขึ้นกับอัตราส่วนภาพ; API มีพรีเซ็ต 1K/2K/4K)
  • การวางแผนแบบวนซ้ำและการแก้ไขตนเอง: มี “หลายสเตจ” ภายในเพื่อค้นหาและแก้ข้อผิดพลาดทั่วไป (มุมมอง ข้อความ เรขาคณิตละเอียด)
  • การเรนเดอร์ข้อความในภาพขั้นสูง: ข้อความหลายภาษาอ่านชัดเจน (ตั้งแต่แคปชันสั้นไปจนถึงย่อหน้าที่ยาว) เหมาะสำหรับโปสเตอร์ ม็อกอัป และอินโฟกราฟิก
  • รองรับ 5 ตัวละคร และความซื่อตรงสำหรับสูงสุด 14 วัตถุ/ภาพอ้างอิง ในเวิร์กโฟลว์เดียว
  • วอเตอร์มาร์ก / แหล่งที่มา: ภาพที่สร้างทั้งหมดมีวอเตอร์มาร์ก SynthID; โมเดลฝังเมตาดาตา C2PA เพื่อระบุแหล่งที่มาในบางการผสานผลิตภัณฑ์

เวอร์ชันและการตั้งชื่อ Gemini 3 Pro Image

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

รายละเอียดทางเทคนิค

สถาปัตยกรรม

  • สายพันธุ์ / แบ็กโบน: Nano Banana Pro ถูกสร้างบนสแตกภาพ Gemini ของ Google ที่พัฒนาอย่างต่อเนื่อง — โดยเฉพาะสถาปัตยกรรม Gemini 3 Pro Image / GEMPIX 2 (กรอบงานภาพ+ข้อความแบบมัลติโหมดที่มีขีดความสามารถสูงกว่า) ซึ่งวิวัฒน์มาจาก Gemini 2.5 Flash Image (“nano-banana” ดั้งเดิม) สู่โมเดลภาพแบบมัลติโหมดโดยกำเนิดพร้อมความสามารถในการให้เหตุผลด้านภาพ-ภาษาแบบขยาย
  • พฤติกรรมของโมเดล: มัลติโหมดโดยกำเนิด (ภาพ + ข้อความ + ความรู้โลก) มีไปป์ไลน์ชัดเจนสำหรับการผสานหลายภาพ และมีตัววางแผนแบบแบ่งสเตจภายในที่ปรับแต่งผลลัพธ์หลายรอบแทนการสร้างตัวอย่างเดียวแบบคงที่ รายงานเบื้องต้นชี้ว่าการให้เหตุผลเชิงเรขาคณิต/ออปติก (แก้ว การหักเห) แข็งแรงขึ้นเมื่อเทียบกับรุ่นก่อน
  • การคิด / การปรับละเอียดภายใน: โมเดลใช้กระบวนการ “การคิด” ที่มองเห็นได้ภายในเพื่อปรับองค์ประกอบ (API ระบุพฤติกรรมนี้และระบุว่าขั้นตอนภายในเหล่านี้ไม่ถูกคิดเป็นโทเคนภาพผลลัพธ์)
  • การกราวด์ดิ้ง & เครื่องมือ: รองรับ Search grounding (ผสานข้อเท็จจริงจากเว็บในงานสร้างไดอะแกรม/อินโฟกราฟิก) และรองรับ system instructions เพื่อการควบคุมที่มีความกำหนดแน่ชัดมากขึ้น

พารามิเตอร์ API หลัก:

  • thinking_level (ต่ำ / สูง) สำหรับปรับสมดุลระหว่างความหน่วงกับความลึกในการให้เหตุผล
  • media_resolution (ต่ำ/กลาง/สูง) เพื่อควบคุมโทเคนการอ่านรายละเอียด/OCR ของภาพ
  • generationConfig.imageConfig เพื่อควบคุมอัตราส่วนภาพ/ความละเอียดของผลลัพธ์ภาพ

ข้อจำกัดของภาพ:

  • รูปแบบอินพุตที่รองรับ: ข้อความและภาพ (โมเดลไม่รับเสียงหรือวิดีโอเป็นอินพุตการสร้างภาพ)
  • จำนวนภาพสูงสุดต่อพรอมป์: 14 (สำหรับ Gemini 3 Pro Image preview)
  • ขนาดภาพสูงสุด (อัปโหลด): 7 MB ต่อภาพอินพุต
  • อัตราส่วนภาพที่รองรับ: 1:1, 3:2, 16:9, 9:16, 21:9 เป็นต้น

ภาพผลลัพธ์ / โทเคน: ขีดจำกัดสูง รองรับ 4K/4096px

ประสิทธิภาพตามการทดสอบ

สรุปสั้น: การทดสอบสาธารณะ/ในช่วงแรกส่วนใหญ่เป็นเชิงคุณภาพ/ขับเคลื่อนโดยชุมชน แต่รายงานอย่างสม่ำเสมอว่ามีการปรับปรุงที่ชัดเจนด้านความละเอียด การลดอาร์ติแฟกต์ และความถูกต้องทางกายภาพเมื่อเทียบกับ nano-banana รุ่นเดิม (Gemini 2.5 Flash Image) มี “ความท้าทาย” ที่ระบุชื่อซึ่งแสดงให้เห็นถึงความก้าวหน้าทางภาพอย่างชัดเจน แต่ยังไม่มีตารางเกณฑ์ชี้วัดเชิงตัวเลขมาตรฐานที่เผยแพร่โดย Google เพื่อเปรียบเทียบ v1 → v2 ตามเมตริกการสร้างภาพมาตรฐาน

  • การทดสอบเชิงคุณภาพโดยชุมชน: ขอบคมขึ้น รายละเอียดระดับจิ๋วคมชัด สีเที่ยงตรงขึ้น และยึดตามพรอมป์ได้ซื่อสัตย์กว่า (ลดอุปกรณ์ประกอบฉากที่หลงสร้าง และตัวละครสม่ำเสมอกว่า) การทดสอบที่นิยม เช่น “Wine Glass Test” และ “Glass Burger Challenge” ที่ GEMPIX2 (Nano Banana Pro) จัดการความโปร่งใสและการหักเหได้ดีกว่าบิลด์ก่อนหน้าอย่างเห็นได้ชัด
  • การจัดการข้อความ: Nano Banana Pro แสดงให้เห็นถึงการปรับปรุงที่ชัดเจนด้านไทโปกราฟีและการวางข้อความในภาพ (เป็นจุดอ่อนถาวรของโมเดลภาพจำนวนมาก) การเปรียบเทียบโดยชุมชนชี้ว่ามีตัวอักษรที่เรนเดอร์ผิดรูปน้อยลง
  • ปริมาณงาน / UX: ความเร็วในการวนรอบเร็วขึ้น และ UX ทำการปรับละเอียดแบบหลายสเตจที่ฝั่งแบ็กเอนด์ ทำให้ผู้ใช้เห็นผลลัพธ์รอบแรกที่เชื่อถือได้มากขึ้น (ลดการต้องสุ่มใหม่ด้วยตนเอง)

ข้อจำกัด & ความเสี่ยง

  • ตัวกรองเนื้อหา & การตรวจจับ: แพลตฟอร์มที่ผสานโมเดล (เช่น Whisk/แอปบุคคลที่สาม) อาจเปิดใช้งานการตรวจจับบุคคลมีชื่อเสียงหรือใบหน้าที่เข้มงวดและบล็อกผลลัพธ์บางอย่าง ซึ่งส่งผลต่อเวิร์กโฟลว์สร้างสรรค์ที่พึ่งพาความเหมือนจริงของคนดัง
  • การหลงสร้าง / กรณีขอบของการให้เหตุผล: แม้จะปรับปรุงขึ้น แต่ยังสามารถสร้างอาร์ติแฟกต์ที่ไม่สมจริงทางกายภาพได้ โดยเฉพาะกับข้อความเชิงสัญลักษณ์หนาแน่นในภาพหรือไดอะแกรมทางเทคนิคขั้นสูง — แม้ว่า NB2 จะดูเหมือนลดข้อผิดพลาดเหล่านี้เมื่อเทียบกับรุ่นก่อน
  • ความปลอดภัย & การใช้ผิดวัตถุประสงค์: โมเดลสร้างภาพอาจถูกใช้สร้างเนื้อหาที่เป็นปัญหาหรือเป็นอันตราย Google ใช้ข้อจำกัด ตัวกรองเนื้อหา และวอเตอร์มาร์ก SynthID เพื่อช่วยเรื่องแหล่งที่มา; อย่างไรก็ตาม ยังมีการใช้ผิดวัตถุประสงค์เกิดขึ้น (กรณีถกเถียงโด่งดังที่เกี่ยวข้องกับภาพที่สร้างโดย Nano Banana ในบริบททางการเมืองอ่อนไหว)

การเปรียบเทียบ Nano Banana Pro กับโมเดลอื่น

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — การผสานใช้งานบนมือถือที่แข็งแกร่ง การผสานหลายภาพ การแก้ไขตนเองแบบวนรอบ เนทีฟ 2K/อัปสเกล 4K และผสานแน่นกับแอป Google (Search, Photos, Workspace/Gemini) เหมาะกับเวิร์กโฟลว์ที่ต้องการการแก้ไขที่เชื่อถือได้ ความต่อเนื่อง และการผสานกับบริการของ Google อย่างแน่นหนา
  • Midjourney — เด่นด้านงานศิลป์เชิงสไตล์และการเขียนพรอมป์โดยชุมชน; โดยทั่วไปไม่เน้นการผสานหลายภาพที่แม่นยำระดับภาพถ่ายหรือไปป์ไลน์แก้ไขมัลติโหมดเชิงลึก
  • Stable Diffusion / น้ำหนักแบบเปิด — เปิดเต็มที่ ปรับแต่งได้สูง และโฮสต์ได้ในเครื่อง; ระบบนิเวศของเช็กพอยต์และการปรับจูนเป็นข้อได้เปรียบชี้ขาดสำหรับงานวิจัยและการใช้งานออฟไลน์ มีการผสานมือถือแบบ “คลิกเดียว” น้อยกว่า และความสม่ำเสมอของการแก้ไขหลายภาพนอกกล่องน้อยกว่า Nano Banana Pro
  • Seedream 4.0 (ByteDance) — วางตำแหน่งเป็นคู่แข่งของ Nano Banana โดยเน้นการเรนเดอร์เร็วมาก เอาต์พุต 2K และรองรับภาพอ้างอิงจำนวนมาก (สูงสุดหกภาพ) วางตำแหน่งเป็นทางเลือกสำหรับมือโปร/ครีเอเตอร์

(การเปรียบเทียบเหล่านี้อยู่ในระดับสูง; เลือกเครื่องมือให้ตรงกับเวิร์กโฟลว์ของคุณ: ความเปิดกว้าง/ปรับแต่งได้ → Stable Diffusion; งานศิลป์เชิงสไตล์ → Midjourney; การแก้ไขบนมือถือที่สอดคล้องและวนรอบเชิงรุก → ครอบครัว Nano Banana Pro/Gemini 3 Pro Image)

กรณีใช้งานจริง

  • การแก้ไขภาพบนมือถือ & ฟิลเตอร์สร้างสรรค์ (การผสาน Google Photos — ปรับสไตล์ ผสานฉากหลัง ปรับองค์ประกอบภาพพอร์ตเทรตใหม่)

  • สินทรัพย์การตลาด & โฆษณา — สร้างคอนเซ็ปต์รวดเร็ว ตัวละครแบรนด์ที่คงที่ในหลายเฟรม/มุม

  • คอนเซ็ปต์อาร์ต & สตอรีบอร์ด — การผสานหลายภาพช่วยรักษาความต่อเนื่องของตัวละครระหว่างแต่ละพาเนล

  • อีคอมเมิร์ซ / ม็อกอัปสินค้า — สร้างภาพสินค้าที่สม่ำเสมอในบริบท/สภาพแสงต่าง ๆ

  • การสร้างต้นแบบอย่างรวดเร็วสำหรับทรัพย์สิน AR/VR — เอาต์พุตคุณภาพสูง 2K/4K ที่สามารถอัปสเกลสำหรับงานดื่มด่ำ

  • วิธีเข้าถึง API ของ gemini-3-pro-image(Nano Banana Pro)

ขั้นตอนที่จำเป็น

  • เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน
  • รับคีย์รับรองสิทธิ์การเข้าถึง API ของอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเคน: sk-xxxxx แล้วส่ง
  • รับ URL ของไซต์นี้: https://api.cometapi.com/

วิธีใช้

  1. เลือกเอ็นด์พอยต์ “gemini-3-pro-image” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมี Apifox สำหรับการทดสอบเพื่อความสะดวกของคุณ
  2. แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ
  3. แทรกคำถามหรือคำขอของคุณลงในฟิลด์ content — โมเดลจะตอบกลับสิ่งนี้
  4. . ประมวลผลการตอบกลับ API เพื่อรับคำตอบที่สร้างขึ้น

CometAPI มี REST API ที่เข้ากันได้เต็มรูปแบบ — สำหรับการย้ายงานอย่างไร้รอยต่อ รายละเอียดสำคัญ :

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names: gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json

คำถามที่พบบ่อย

Can Gemini 3 Pro Image generate 4K resolution images?

Yes, Nano Banana Pro (Gemini 3 Pro Image) supports native output up to 4K resolution with aspect ratios including 1:1, 3:2, 16:9, 9:16, and 21:9. It also supports 1K and 2K presets via the imageConfig parameter.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro features advanced in-image text rendering with clear, legible multi-language text support—from short captions to long paragraphs. This makes it ideal for posters, infographics, UI mockups, and marketing assets.

Can I edit images conversationally with Gemini 3 Pro Image?

Yes, Nano Banana Pro supports multi-turn conversational editing. Simply ask for changes like 'Make the background a sunset' and the model maintains visual context through Thought Signatures between turns.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro excels at iterative self-correction, consistent character preservation across multiple edits, and tight Google ecosystem integration. It handles up to 14 reference images for complex multi-image fusion workflows.

Does Nano Banana Pro use Google Search for grounded image generation?

Yes, Nano Banana Pro can use Search grounding to verify facts before generating images. For example, it can fetch current weather data to create an accurate Tokyo weather infographic.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro supports up to 14 input images per prompt with a maximum of 7MB per image. It maintains subject and character consistency across up to 5 characters in complex multi-image fusion scenarios.

คุณสมบัติสำหรับ Nano Banana Pro

สำรวจคุณสมบัติหลักของ Nano Banana Pro ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Nano Banana Pro

สำรวจราคาที่แข่งขันได้สำหรับ Nano Banana Pro ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Nano Banana Pro สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

โค้ดตัวอย่างและ API สำหรับ Nano Banana Pro

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ Nano Banana Pro เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Nano Banana Pro ในโครงการของคุณ
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

รุ่นของ Nano Banana Pro

เหตุผลที่ Nano Banana Pro มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ
รหัสโมเดลคำอธิบายพร้อมใช้งานคำขอ
nano-banana-pro-allเทคโนโลยีที่ใช้เป็นแบบไม่เป็นทางการและการสร้างผลลัพธ์ไม่เสถียร เป็นต้น,Chat รูปแบบ✅Chat รูปแบบ
gemini-3-pro-imageแนะนำ ชี้ไปที่รุ่นล่าสุด✅Gemini สร้างภาพ
gemini-3-pro-image-previewพรีวิวอย่างเป็นทางการ✅Gemini สร้างภาพ

โมเดลเพิ่มเติม