จะใช้ Nano Banana Pro(Gemini 3 Pro Image) API อย่างไร ?

Nano Banana Pro — หรือที่รู้จักอย่างเป็นทางการว่า Gemini 3 Pro Image — คือโมเดลสร้างและแก้ไขภาพระดับสตูดิโอตัวใหม่ของ Google/DeepMind ที่ผสานการให้เหตุผลแบบมัลติโหมดขั้นสูง การเรนเดอร์ข้อความในภาพที่คมชัด การผสานหลายภาพเข้าด้วยกัน และการควบคุมงานสร้างสรรค์ระดับสตูดิโอ

Nano Banana Pro คืออะไร และทำไมคุณควรสนใจ?

Nano Banana Pro คือโมเดลสร้างภาพและแก้ไขภาพรุ่นใหม่ล่าสุดของ Google — รุ่น “Gemini 3 Pro Image” — ที่ออกแบบมาเพื่อสร้างภาพและข้อความบนภาพที่มีความคมชัดสูง เข้าใจบริบท และมีคุณภาพระดับสตูดิโอได้สูงสุดถึง 4K เป็นรุ่นต่อจากโมเดล Nano Banana รุ่นก่อนหน้า (Gemini 2.5 Flash Image / “Nano Banana”) โดยมีการให้เหตุผลที่ดีขึ้น การทำ Search grounding (ข้อเท็จจริงจากโลกจริง) การเรนเดอร์ข้อความที่แข็งแกร่งขึ้น และการควบคุมการแก้ไขเฉพาะจุดที่ทรงพลังยิ่งขึ้น โมเดลนี้พร้อมใช้งานภายในแอป Gemini สำหรับผู้ใช้แบบโต้ตอบ และสามารถเข้าถึง Nano Banana Pro ผ่าน Gemini API มาตรฐานได้ โดยคุณเลือกตัวระบุโมเดลที่เฉพาะเจาะจง (gemini-3-pro-image-preview หรือรุ่นเสถียรที่มาแทนในภายหลัง) สำหรับการเข้าถึงแบบโปรแกรมได้

เหตุผลที่สิ่งนี้สำคัญ: Nano Banana Pro ไม่ได้ถูกสร้างมาแค่เพื่อทำภาพสวย ๆ แต่เพื่อ ทำให้ข้อมูลมองเห็นได้ — อินโฟกราฟิก ภาพสรุปที่ขับเคลื่อนด้วยข้อมูล (สภาพอากาศ กีฬา) โปสเตอร์ที่มีข้อความจำนวนมาก ม็อกอัปสินค้า และการผสานหลายภาพเข้าด้วยกัน (รองรับภาพนำเข้าได้สูงสุด 14 ภาพ และคงความสม่ำเสมอของตัวละครได้สูงสุด 5 คน) สำหรับนักออกแบบ ทีมผลิตภัณฑ์ และนักพัฒนา การผสมผสานระหว่างความแม่นยำ ข้อความบนภาพ และการเข้าถึงแบบโปรแกรมได้ เปิดเวิร์กโฟลว์การผลิตที่ก่อนหน้านี้ทำให้เป็นอัตโนมัติได้ยาก

ฟังก์ชันใดบ้างที่เปิดให้ใช้ผ่าน API?

ความสามารถของ API ที่เปิดให้นักพัฒนาใช้งานโดยทั่วไป ได้แก่:

การสร้างภาพจากข้อความ (Text → Image) (แบบขั้นตอนเดียวหรือแบบหลายขั้นตอนด้วยโฟลว์การจัดองค์ประกอบ “thinking”)
การแก้ไขภาพ (มาสก์เฉพาะจุด, inpainting, การปรับสไตล์)
การผสานหลายภาพ (รวมภาพอ้างอิงเข้าด้วยกัน)
การควบคุมคำขอขั้นสูง: ความละเอียด, อัตราส่วนภาพ, ขั้นตอน post-processing และร่องรอย “composition thought” สำหรับการดีบัก/ตรวจสอบได้ในโหมด preview

นวัตกรรมหลักและฟังก์ชันของ Nano Banana Pro

การให้เหตุผลด้านเนื้อหาที่ชาญฉลาดยิ่งขึ้น

ใช้สแตกการให้เหตุผลของ Gemini 3 Pro เพื่อตีความคำสั่งด้านภาพที่ซับซ้อนหลายขั้นตอน (เช่น “สร้างอินโฟกราฟิก 5 ขั้นตอนจากชุดข้อมูลนี้และเพิ่มคำบรรยายสองภาษา”) API เปิดให้ใช้กลไก “Thinking” ที่สามารถสร้างการทดสอบการจัดองค์ประกอบชั่วคราวเพื่อปรับแต่งผลลัพธ์สุดท้าย

เหตุผลที่สำคัญ: แทนที่จะประมวลผลครั้งเดียวจาก prompt → pixel โมเดลจะทำกระบวนการ “thinking” ภายในเพื่อปรับแต่งการจัดองค์ประกอบ และสามารถเรียกใช้เครื่องมือภายนอกได้ (เช่น Google Search) เพื่อยึดโยงกับข้อเท็จจริง (เช่น ป้ายกำกับแผนภาพที่ถูกต้อง หรือป้ายข้อความที่ถูกต้องตามโลแคล) สิ่งนี้ทำให้ภาพไม่เพียงสวยขึ้น แต่ยังถูกต้องในเชิงความหมายมากขึ้นสำหรับงานอย่างอินโฟกราฟิก แผนภาพ หรือม็อกอัปสินค้า

วิธีทำให้ได้ผล: “Thinking” ของ Nano Banana Pro คือการผ่านกระบวนการให้เหตุผล/จัดองค์ประกอบภายในแบบควบคุมได้ ซึ่งโมเดลจะสร้างภาพขั้นกลางและร่องรอยการให้เหตุผลก่อนสร้างภาพสุดท้าย API เปิดเผยว่าโมเดลอาจสร้างเฟรมชั่วคราวได้สูงสุดสองเฟรม และภาพสุดท้ายคือขั้นตอนสุดท้ายของลำดับนั้น ในงาน production สิ่งนี้ช่วยเรื่องการจัดองค์ประกอบ การวางข้อความ และการตัดสินใจด้านเลย์เอาต์

การเรนเดอร์ข้อความที่แม่นยำยิ่งขึ้น

ปรับปรุงการแสดงข้อความในภาพให้ชัดเจน อ่านออก และตรงตามภาษาอย่างมีนัยสำคัญ (เมนู โปสเตอร์ แผนภาพ) Nano Banana Pro ยกระดับการเรนเดอร์ข้อความในภาพไปอีกขั้น:

ข้อความในภาพชัดเจน อ่านง่าย และสะกดถูกต้อง
รองรับการสร้างหลายภาษา (รวมถึงภาษาจีน ญี่ปุ่น เกาหลี อาหรับ ฯลฯ)
อนุญาตให้ผู้ใช้เขียนย่อหน้ายาวหรือข้อความบรรยายหลายบรรทัดลงในภาพได้โดยตรง
รองรับการแปลและการปรับให้เข้ากับท้องถิ่นโดยอัตโนมัติ

เหตุผลที่สำคัญ: โดยทั่วไปโมเดลภาพมักมีปัญหาในการเรนเดอร์ข้อความให้อ่านได้และจัดวางได้ดี Nano Banana Pro ถูกปรับให้เหมาะกับการเรนเดอร์ข้อความและการแปลท้องถิ่นอย่างเชื่อถือได้โดยเฉพาะ (เช่น การแปลพร้อมคงเลย์เอาต์ไว้) ซึ่งปลดล็อกกรณีใช้งานเชิงสร้างสรรค์จริง เช่น โปสเตอร์ บรรจุภัณฑ์ หรือโฆษณาหลายภาษา

วิธีทำให้ได้ผล: การปรับปรุงด้านการเรนเดอร์ข้อความมาจากสถาปัตยกรรมมัลติโหมดพื้นฐานและการฝึกด้วยชุดข้อมูลที่เน้นตัวอย่างข้อความในภาพ ร่วมกับชุดประเมินผลเฉพาะทาง (การประเมินโดยมนุษย์และ regression sets) โมเดลเรียนรู้ที่จะจัดแนวรูปร่างของ glyph ฟอนต์ และข้อจำกัดด้านเลย์เอาต์ เพื่อสร้างข้อความที่อ่านได้และแปลตามท้องถิ่นภายในภาพ — แม้ว่าข้อความขนาดเล็กและย่อหน้าที่หนาแน่นมากยังคงมีโอกาสผิดพลาดได้

ความสม่ำเสมอของภาพและความคมชัดที่แข็งแกร่งขึ้น

การควบคุมระดับสตูดิโอ (แสง โฟกัส มุมกล้อง การเกรดสี) และการจัดองค์ประกอบจากหลายภาพ (รองรับภาพอ้างอิงสูงสุด 14 ภาพ พร้อมข้อยืดหยุ่นพิเศษสำหรับตัวแบบมนุษย์หลายคน) ช่วยรักษาความสม่ำเสมอของตัวละคร (คงบุคคล/ตัวละครเดิมไว้ตลอดการแก้ไข) และอัตลักษณ์ของแบรนด์ในสินทรัพย์ที่สร้างขึ้นหลายชิ้น โมเดลรองรับเอาต์พุตแบบเนทีฟที่ 1K/2K/4K

เหตุผลที่สำคัญ: เวิร์กโฟลว์ด้านการตลาดและบันเทิงต้องการตัวละครที่คงเส้นคงวาข้ามช็อตและการแก้ไขต่าง ๆ โมเดลสามารถรักษาความคล้ายได้สูงสุด ห้าคน และผสมภาพอ้างอิงได้สูงสุด 14 ภาพไว้ในองค์ประกอบเดียว พร้อมสร้างจาก Sketch → 3D Render ได้ สิ่งนี้มีประโยชน์สำหรับงานโฆษณา บรรจุภัณฑ์ หรือการเล่าเรื่องหลายช็อต

วิธีทำให้ได้ผล: อินพุตของโมเดลรับหลายภาพพร้อมการกำหนดบทบาทอย่างชัดเจน (เช่น “Image A: pose”, “Image B: face reference”, “Image C: background texture”) สถาปัตยกรรมจะทำ conditioning การสร้างจากภาพเหล่านั้น เพื่อคงอัตลักษณ์/ท่าทาง/สไตล์ ขณะใช้การแปลงต่าง ๆ (แสง กล้อง)

เกณฑ์วัดประสิทธิภาพของ Nano Banana Pro

Nano Banana Pro (Gemini 3 Pro Image) “โดดเด่นในเกณฑ์วัด AI แบบ Text→Image” และแสดงให้เห็นถึงการให้เหตุผลและการยึดโยงกับบริบทที่ดีขึ้นเมื่อเทียบกับ Nano Banana รุ่นก่อนหน้า โดยเน้นความคมชัดที่สูงขึ้นและการเรนเดอร์ข้อความที่ดีขึ้นเมื่อเทียบกับรุ่นก่อน

จะใช้ Nano Banana Pro(Gemini 3 Pro Image) API อย่างไร ?

แนวทางด้านประสิทธิภาพเชิงปฏิบัติ

คาดการณ์ได้ว่า เวลาแฝง และต้นทุนสำหรับการเรนเดอร์คุณภาพสูงระดับ 2K/4K จะสูงกว่า 1K หรือโมเดล “Flash” ที่ปรับให้เหมาะกับความเร็ว หาก throughput/latency มีความสำคัญ ให้ใช้รุ่น flash (เช่น Gemini 2.5 Flash / Nano Banana) สำหรับงานปริมาณมาก; ใช้ Nano Banana Pro / gemini-3-pro-image สำหรับงานที่ต้องการคุณภาพสูงและการให้เหตุผลที่ซับซ้อน

นักพัฒนาจะเข้าถึง Nano Banana Pro ได้อย่างไร?

ควรเลือก endpoint และโมเดลใด

ตัวระบุโมเดล (preview / pro): gemini-3-pro-image-preview (preview) — ใช้ตัวนี้เมื่อคุณต้องการความสามารถของ Nano Banana Pro สำหรับงานที่เร็วกว่าและต้นทุนต่ำกว่า gemini-2.5-flash-image (Nano Banana) ยังคงพร้อมใช้งาน

ช่องทางที่ใช้ได้

Gemini API (generativelanguage endpoint): คุณสามารถใช้คีย์ CometAPI เพื่อเข้าถึง xx ได้ CometAPI นำเสนอ API เดียวกันในราคาที่คุ้มกว่าบนเว็บไซต์ทางการ ใช้การเรียก Direct HTTP / SDK ไปที่ generateContent สำหรับการสร้างภาพ (ตัวอย่างด้านล่าง)
Google AI Studio: อินเทอร์เฟซเว็บสำหรับทดลองอย่างรวดเร็วและรีมิกซ์แอปเดโม
Vertex AI (enterprise): throughput แบบ provisioned, ตัวเลือกด้านบิลลิง (pay-as-you-go / enterprise tiers) และตัวกรองความปลอดภัยสำหรับงาน production ขนาดใหญ่ ใช้ Vertex เมื่อต้องการผสานเข้ากับ pipeline ขนาดใหญ่หรืองาน batch rendering

ระดับฟรีมีข้อจำกัดด้านการใช้งาน; หากเกินขีดจำกัดจะกลับไปใช้ Nano Banana ระดับ Plus/Pro/Ultra ให้ขีดจำกัดที่สูงกว่าและเอาต์พุตแบบไม่มีลายน้ำ แต่ Ultra สามารถใช้ในเครื่องมือวิดีโอ Flow และ Antigravity IDE ในโหมด 4K ได้

ฉันจะสร้างภาพด้วย Nano Banana Pro ได้อย่างไร (ทีละขั้นตอน)?

1) สูตรใช้งานแบบโต้ตอบอย่างรวดเร็วเพื่อใช้ Gemini app

เปิด Gemini → Tools → Create images
เลือก Thinking (Nano Banana Pro) เป็นโมเดล
ป้อน prompt: อธิบายตัวแบบ การกระทำ อารมณ์ แสง มุมกล้อง อัตราส่วนภาพ และข้อความใด ๆ ที่ต้องการให้ปรากฏบนภาพ ตัวอย่าง:
“Create a 4K poster of a robotics workshop: a diverse team around a table, blueprint overlay, bold headline ‘Robots in Action’ in sans serif, warm tungsten light, shallow depth of field, cinematic 16:9.”
(ไม่บังคับ) อัปโหลดภาพได้สูงสุด 14 ภาพเพื่อผสานหรือใช้เป็นภาพอ้างอิง ใช้เครื่องมือเลือก/มาสก์เพื่อแก้ไขเฉพาะบริเวณ
สร้างภาพ ปรับแก้ด้วยภาษาธรรมชาติ (เช่น “make the headline blue and aligned top-center; increase contrast on the blueprint”) จากนั้นส่งออก

2) ใช้ HTTP เพื่อส่งไปยัง Gemini image endpoint

คุณต้องเข้าสู่ระบบ CometAPI เพื่อรับคีย์

# save your API key to $CometAPI_API_KEY securely before running

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "role": "user",
      "parts": [{
        "text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
      }]
    }],
    "generationConfig": {
      "imageConfig": {
        "resolution": "4096x4096",
        "aspectRatio": "1:1"
      }
    }
  }' \
  | jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
  | base64 --decode > nano_banana_pro_4k.png

ตัวอย่างนี้จะเขียน payload ภาพแบบ base64 ลงในไฟล์ PNG พารามิเตอร์ generationConfig.imageConfig.resolution ใช้สำหรับขอเอาต์พุตระดับ 4K (มีให้ใช้ในโมเดล 3 Pro Image)

3) เรียกใช้ `generateContent` โดยตรงผ่าน SDK สำหรับการสร้างภาพ

ต้องติดตั้ง Google SDK และรับการยืนยันตัวตนของ Google ตัวอย่าง Python (ข้อความ + ภาพอ้างอิง + grounding):

# pip install google-genai pillow

from google import genai
from PIL import Image
import base64

client = genai.Client()  # reads credentials from env / config per SDK docs

# Read a reference image and set inline_data

with open("ref1.png", "rb") as f:
    ref1_b64 = base64.b64encode(f.read()).decode("utf-8")

prompt_parts = [
    {"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
    {"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,
    generation_config={
        "imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
        # tools can be provided to ground facts, e.g. "google_search"

        "tools": 
    }
)

for part in response.candidates.content.parts:
    if part.inline_data:
        image = part.as_image()
        image.save("product_ad.png")

ตัวอย่างนี้แสดงการอัปโหลดภาพอ้างอิงแบบ inline และการร้องขอองค์ประกอบระดับ 4K พร้อมเปิดใช้ google_search เป็นเครื่องมือ Python SDK จะจัดการรายละเอียด REST ระดับล่างให้

การผสานหลายภาพและความสม่ำเสมอของตัวละคร

หากต้องการสร้างภาพคอมโพสิตที่คงบุคคลเดิมไว้ข้ามฉาก ให้ส่ง inline_data หลายรายการ (เลือกจากชุดภาพของคุณ) และระบุคำสั่งเชิงสร้างสรรค์ว่าโมเดลควร “preserve identity across outputs”

ตัวอย่างใช้งานสั้น ๆ — prompt จริงและโฟลว์ที่คาดหวัง

Prompt:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."

Pipeline ที่คาดหวัง: app → prompt template + ข้อมูล CSV → แทนที่ placeholder ใน prompt → เรียก API ด้วย image_size=2048x1152 → รับ base64 PNG → บันทึก asset + provenance metadata → หากจำเป็นอาจซ้อนฟอนต์ที่แม่นยำด้วย compositor เพิ่มเติม

ฉันควรออกแบบ production pipeline และจัดการเรื่องความปลอดภัย / provenance อย่างไร?

สถาปัตยกรรม production ที่แนะนำ

Prompt + draft pass (โมเดลเร็ว): ใช้ gemini-2.5-flash-image (Nano Banana) เพื่อสร้างตัวเลือกจำนวนมากที่ความละเอียดต่ำในต้นทุนที่ประหยัด
การคัดเลือกและปรับแต่ง: เลือก candidate ที่ดีที่สุด ปรับแต่ง prompt และใช้ inpainting/การแก้ไขด้วยมาสก์เพื่อความแม่นยำ
การเรนเดอร์สุดท้ายความคมชัดสูง: เรียก gemini-3-pro-image-preview (Nano Banana Pro) สำหรับเรนเดอร์สุดท้ายระดับ 2K/4K และ postprocessing (upsampling, color grade)
Provenance และ metadata: จัดเก็บ prompt, เวอร์ชันโมเดล, timestamp และข้อมูล SynthID ในระบบเก็บ metadata ของ asset — โมเดลจะติดลายน้ำ SynthID และสามารถย้อนรอยเอาต์พุตกลับมาเพื่อการปฏิบัติตามข้อกำหนดและการตรวจสอบเนื้อหาได้

ความปลอดภัย สิทธิ์ และการกลั่นกรอง

ลิขสิทธิ์และการเคลียร์สิทธิ์: อย่าอัปโหลดหรือสร้างเนื้อหาที่ละเมิดสิทธิ์ ใช้การยืนยันจากผู้ใช้อย่างชัดเจนสำหรับภาพหรือ prompt ที่ผู้ใช้ส่งเข้ามาซึ่งอาจสร้างภาพเหมือนของบุคคลที่จดจำได้ ต้องปฏิบัติตามนโยบายการใช้งานต้องห้ามของ Google และตัวกรองความปลอดภัยของโมเดล
การกรองและการตรวจสอบอัตโนมัติ: นำภาพที่สร้างแล้วเข้าสู่ pipeline กลั่นกรองเนื้อหาภายใน (NSFW, สัญลักษณ์ความเกลียดชัง, การตรวจจับเนื้อหาทางการเมือง/ที่มีผลผูกพัน) ก่อนใช้งานต่อหรือแสดงผลสู่สาธารณะ

ฉันจะทำ image editing (inpainting), การผสานหลายภาพ และการเรนเดอร์ข้อความได้อย่างไร?

Nano Banana Pro รองรับเวิร์กโฟลว์การแก้ไขแบบมัลติโหมด: ระบุภาพนำเข้าหนึ่งภาพหรือหลายภาพพร้อมคำสั่งข้อความที่อธิบายการแก้ไข (ลบวัตถุ เปลี่ยนท้องฟ้า เพิ่มข้อความ) API รับภาพ + ข้อความในคำขอเดียวกัน; โมเดลสามารถสร้างข้อความและภาพสลับกันในผลลัพธ์ได้ รูปแบบตัวอย่างรวมถึงการแก้ไขด้วยมาสก์และการผสมหลายภาพ (style transfer / composition) โปรดดูเอกสารสำหรับ contents arrays ที่รวม text blobs และ binary images เข้าด้วยกัน

ตัวอย่าง: แก้ไข (Python pseudo-flow)

from google import genai
from PIL import Image

client = genai.Client()

prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"

# contents can include Image objects or binary data per SDK; see doc for exact call

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,  # order matters: image + instruction

)
# Save result as before

การแก้ไขแบบสนทนานี้ช่วยให้คุณค่อย ๆ ปรับผลลัพธ์จนได้ asset ที่พร้อมใช้งานจริง

ตัวอย่าง Node.js — แก้ไขภาพด้วย mask และภาพอ้างอิงหลายภาพ

// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');

const auth = new GoogleAuth({ scopes:  });
async function runEdit() {
  const client = await auth.getClient();
  const token = await client.getAccessToken();
  const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
  const MODEL = "gemini-3-pro-image";

  // Attach binary image content or URLs depending on API.
  const payload = {
    model: MODEL,
    prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
    inputs: {
      referenceImages: [
        { uri: "gs://my-bucket/photo_subject.jpg" },
        { uri: "gs://my-bucket/target_studio.jpg" }
      ],
      mask: { uri: "gs://my-bucket/mask.png" },
      imageConfig: { resolution: "2048x2048", format: "png" }
    },
    options: { preserveIdentity: true }
  };

  const res = await fetch(API_URL, {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${token.token}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify(payload)
  });
  const out = await res.json();
  console.log(JSON.stringify(out, null, 2));
}
runEdit();

(บางครั้ง API อาจรับ Cloud Storage URI หรือ payload ภาพแบบ base64; โปรดตรวจสอบเอกสาร Gemini API สำหรับรูปแบบอินพุตที่แน่นอน)

สำหรับข้อมูลเกี่ยวกับการสร้างและแก้ไขภาพโดยใช้ CometAPI โปรดดูที่ Guide to calling gemini-3-pro-image .

บทสรุป

Nano Banana Pro (Gemini 3 Pro Image) คือก้าวกระโดดระดับ production ในการสร้างภาพ: เป็นเครื่องมือสำหรับการทำให้ข้อมูลมองเห็นได้ การสร้างการแก้ไขแบบ localized และการขับเคลื่อนเวิร์กโฟลว์ของนักพัฒนา ใช้แอป Gemini สำหรับการสร้างต้นแบบอย่างรวดเร็ว ใช้ API สำหรับการผสานเข้ากับระบบ production และปฏิบัติตามคำแนะนำข้างต้นเพื่อควบคุมต้นทุน รักษาความปลอดภัย และคงคุณภาพของแบรนด์ ควรทดสอบกับเวิร์กโฟลว์ของผู้ใช้จริงเสมอ และจัดเก็บ provenance metadata เพื่อให้เป็นไปตามข้อกำหนดด้านความโปร่งใสและการตรวจสอบย้อนหลัง

ใช้ Nano Banana Pro เมื่อคุณต้องการ asset คุณภาพระดับสตูดิโอ การควบคุมองค์ประกอบอย่างแม่นยำ การเรนเดอร์ข้อความในภาพที่ดีขึ้น และความสามารถในการผสานภาพอ้างอิงหลายภาพให้เป็นเอาต์พุตที่สอดคล้องกันหนึ่งชิ้น

นักพัฒนาสามารถเข้าถึง Gemini 3 Pro Image( Nano Banana Pro) API ผ่าน CometAPI ได้ หากต้องการเริ่มต้น ให้สำรวจความสามารถของโมเดลของ CometAPI ใน Playground และศึกษา API guide สำหรับคำแนะนำโดยละเอียด ก่อนเข้าถึง โปรดตรวจสอบว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับ API key แล้ว CometAPI เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยให้คุณผสานระบบได้ง่ายขึ้น

พร้อมเริ่มใช้งานหรือยัง?→ สมัครใช้งาน CometAPI วันนี้ !

หากคุณต้องการทราบเคล็ดลับ คู่มือ และข่าวสารเกี่ยวกับ AI เพิ่มเติม ติดตามเราได้ที่ VK, X และ Discord!

Nano Banana Pro คืออะไร และทำไมคุณควรสนใจ?

ฟังก์ชันใดบ้างที่เปิดให้ใช้ผ่าน API?

นวัตกรรมหลักและฟังก์ชันของ Nano Banana Pro

การให้เหตุผลด้านเนื้อหาที่ชาญฉลาดยิ่งขึ้น

การเรนเดอร์ข้อความที่แม่นยำยิ่งขึ้น

ความสม่ำเสมอของภาพและความคมชัดที่แข็งแกร่งขึ้น

เกณฑ์วัดประสิทธิภาพของ Nano Banana Pro

แนวทางด้านประสิทธิภาพเชิงปฏิบัติ

นักพัฒนาจะเข้าถึง Nano Banana Pro ได้อย่างไร?

ควรเลือก endpoint และโมเดลใด

ช่องทางที่ใช้ได้

ฉันจะสร้างภาพด้วย Nano Banana Pro ได้อย่างไร (ทีละขั้นตอน)?

1) สูตรใช้งานแบบโต้ตอบอย่างรวดเร็วเพื่อใช้ Gemini app

2) ใช้ HTTP เพื่อส่งไปยัง Gemini image endpoint

3) เรียกใช้ `generateContent` โดยตรงผ่าน SDK สำหรับการสร้างภาพ

การผสานหลายภาพและความสม่ำเสมอของตัวละคร

ตัวอย่างใช้งานสั้น ๆ — prompt จริงและโฟลว์ที่คาดหวัง

ฉันควรออกแบบ production pipeline และจัดการเรื่องความปลอดภัย / provenance อย่างไร?

สถาปัตยกรรม production ที่แนะนำ

ความปลอดภัย สิทธิ์ และการกลั่นกรอง

ฉันจะทำ image editing (inpainting), การผสานหลายภาพ และการเรนเดอร์ข้อความได้อย่างไร?

ตัวอย่าง Node.js — แก้ไขภาพด้วย mask และภาพอ้างอิงหลายภาพ

บทสรุป

เข้าถึงโมเดลชั้นนำ ด้วยต้นทุนต่ำ

อ่านเพิ่มเติม

จะใช้ Nano Banana Pro(Gemini 3 Pro Image) API อย่างไร ?

Nano Banana Pro คืออะไร และทำไมคุณควรสนใจ?

ฟังก์ชันใดบ้างที่เปิดให้ใช้ผ่าน API?

นวัตกรรมหลักและฟังก์ชันของ Nano Banana Pro

การให้เหตุผลด้านเนื้อหาที่ชาญฉลาดยิ่งขึ้น

การเรนเดอร์ข้อความที่แม่นยำยิ่งขึ้น

ความสม่ำเสมอของภาพและความคมชัดที่แข็งแกร่งขึ้น

เกณฑ์วัดประสิทธิภาพของ Nano Banana Pro

แนวทางด้านประสิทธิภาพเชิงปฏิบัติ

นักพัฒนาจะเข้าถึง Nano Banana Pro ได้อย่างไร?

ควรเลือก endpoint และโมเดลใด

ช่องทางที่ใช้ได้

ฉันจะสร้างภาพด้วย Nano Banana Pro ได้อย่างไร (ทีละขั้นตอน)?

1) สูตรใช้งานแบบโต้ตอบอย่างรวดเร็วเพื่อใช้ Gemini app

2) ใช้ HTTP เพื่อส่งไปยัง Gemini image endpoint

3) เรียกใช้ generateContent โดยตรงผ่าน SDK สำหรับการสร้างภาพ

การผสานหลายภาพและความสม่ำเสมอของตัวละคร

ตัวอย่างใช้งานสั้น ๆ — prompt จริงและโฟลว์ที่คาดหวัง

ฉันควรออกแบบ production pipeline และจัดการเรื่องความปลอดภัย / provenance อย่างไร?

สถาปัตยกรรม production ที่แนะนำ

ความปลอดภัย สิทธิ์ และการกลั่นกรอง

ฉันจะทำ image editing (inpainting), การผสานหลายภาพ และการเรนเดอร์ข้อความได้อย่างไร?

ตัวอย่าง Node.js — แก้ไขภาพด้วย mask และภาพอ้างอิงหลายภาพ

บทสรุป

เข้าถึงโมเดลชั้นนำ ด้วยต้นทุนต่ำ

อ่านเพิ่มเติม

3) เรียกใช้ `generateContent` โดยตรงผ่าน SDK สำหรับการสร้างภาพ