จะใช้ Nano Banana Pro(Gemini 3 Pro Image) API อย่างไร ?

CometAPI
AnnaNov 20, 2025
จะใช้ Nano Banana Pro(Gemini 3 Pro Image) API อย่างไร ?

Nano Banana Pro — หรือที่รู้จักอย่างเป็นทางการว่า Gemini 3 Pro Image — คือโมเดลสร้างและแก้ไขภาพระดับสตูดิโอตัวใหม่ของ Google/DeepMind ที่ผสานการให้เหตุผลแบบมัลติโหมดขั้นสูง การเรนเดอร์ข้อความในภาพที่คมชัด การผสานหลายภาพเข้าด้วยกัน และการควบคุมงานสร้างสรรค์ระดับสตูดิโอ

Nano Banana Pro คืออะไร และทำไมคุณควรสนใจ?

Nano Banana Pro คือโมเดลสร้างภาพและแก้ไขภาพรุ่นใหม่ล่าสุดของ Google — รุ่น “Gemini 3 Pro Image” — ที่ออกแบบมาเพื่อสร้างภาพและข้อความบนภาพที่มีความคมชัดสูง เข้าใจบริบท และมีคุณภาพระดับสตูดิโอได้สูงสุดถึง 4K เป็นรุ่นต่อจากโมเดล Nano Banana รุ่นก่อนหน้า (Gemini 2.5 Flash Image / “Nano Banana”) โดยมีการให้เหตุผลที่ดีขึ้น การทำ Search grounding (ข้อเท็จจริงจากโลกจริง) การเรนเดอร์ข้อความที่แข็งแกร่งขึ้น และการควบคุมการแก้ไขเฉพาะจุดที่ทรงพลังยิ่งขึ้น โมเดลนี้พร้อมใช้งานภายในแอป Gemini สำหรับผู้ใช้แบบโต้ตอบ และสามารถเข้าถึง Nano Banana Pro ผ่าน Gemini API มาตรฐานได้ โดยคุณเลือกตัวระบุโมเดลที่เฉพาะเจาะจง (gemini-3-pro-image-preview หรือรุ่นเสถียรที่มาแทนในภายหลัง) สำหรับการเข้าถึงแบบโปรแกรมได้

เหตุผลที่สิ่งนี้สำคัญ: Nano Banana Pro ไม่ได้ถูกสร้างมาแค่เพื่อทำภาพสวย ๆ แต่เพื่อ ทำให้ข้อมูลมองเห็นได้ — อินโฟกราฟิก ภาพสรุปที่ขับเคลื่อนด้วยข้อมูล (สภาพอากาศ กีฬา) โปสเตอร์ที่มีข้อความจำนวนมาก ม็อกอัปสินค้า และการผสานหลายภาพเข้าด้วยกัน (รองรับภาพนำเข้าได้สูงสุด 14 ภาพ และคงความสม่ำเสมอของตัวละครได้สูงสุด 5 คน) สำหรับนักออกแบบ ทีมผลิตภัณฑ์ และนักพัฒนา การผสมผสานระหว่างความแม่นยำ ข้อความบนภาพ และการเข้าถึงแบบโปรแกรมได้ เปิดเวิร์กโฟลว์การผลิตที่ก่อนหน้านี้ทำให้เป็นอัตโนมัติได้ยาก

ฟังก์ชันใดบ้างที่เปิดให้ใช้ผ่าน API?

ความสามารถของ API ที่เปิดให้นักพัฒนาใช้งานโดยทั่วไป ได้แก่:

  • การสร้างภาพจากข้อความ (Text → Image) (แบบขั้นตอนเดียวหรือแบบหลายขั้นตอนด้วยโฟลว์การจัดองค์ประกอบ “thinking”)
  • การแก้ไขภาพ (มาสก์เฉพาะจุด, inpainting, การปรับสไตล์)
  • การผสานหลายภาพ (รวมภาพอ้างอิงเข้าด้วยกัน)
  • การควบคุมคำขอขั้นสูง: ความละเอียด, อัตราส่วนภาพ, ขั้นตอน post-processing และร่องรอย “composition thought” สำหรับการดีบัก/ตรวจสอบได้ในโหมด preview

นวัตกรรมหลักและฟังก์ชันของ Nano Banana Pro

การให้เหตุผลด้านเนื้อหาที่ชาญฉลาดยิ่งขึ้น

ใช้สแตกการให้เหตุผลของ Gemini 3 Pro เพื่อตีความคำสั่งด้านภาพที่ซับซ้อนหลายขั้นตอน (เช่น “สร้างอินโฟกราฟิก 5 ขั้นตอนจากชุดข้อมูลนี้และเพิ่มคำบรรยายสองภาษา”) API เปิดให้ใช้กลไก “Thinking” ที่สามารถสร้างการทดสอบการจัดองค์ประกอบชั่วคราวเพื่อปรับแต่งผลลัพธ์สุดท้าย

เหตุผลที่สำคัญ: แทนที่จะประมวลผลครั้งเดียวจาก prompt → pixel โมเดลจะทำกระบวนการ “thinking” ภายในเพื่อปรับแต่งการจัดองค์ประกอบ และสามารถเรียกใช้เครื่องมือภายนอกได้ (เช่น Google Search) เพื่อยึดโยงกับข้อเท็จจริง (เช่น ป้ายกำกับแผนภาพที่ถูกต้อง หรือป้ายข้อความที่ถูกต้องตามโลแคล) สิ่งนี้ทำให้ภาพไม่เพียงสวยขึ้น แต่ยังถูกต้องในเชิงความหมายมากขึ้นสำหรับงานอย่างอินโฟกราฟิก แผนภาพ หรือม็อกอัปสินค้า

วิธีทำให้ได้ผล: “Thinking” ของ Nano Banana Pro คือการผ่านกระบวนการให้เหตุผล/จัดองค์ประกอบภายในแบบควบคุมได้ ซึ่งโมเดลจะสร้างภาพขั้นกลางและร่องรอยการให้เหตุผลก่อนสร้างภาพสุดท้าย API เปิดเผยว่าโมเดลอาจสร้างเฟรมชั่วคราวได้สูงสุดสองเฟรม และภาพสุดท้ายคือขั้นตอนสุดท้ายของลำดับนั้น ในงาน production สิ่งนี้ช่วยเรื่องการจัดองค์ประกอบ การวางข้อความ และการตัดสินใจด้านเลย์เอาต์

การเรนเดอร์ข้อความที่แม่นยำยิ่งขึ้น

ปรับปรุงการแสดงข้อความในภาพให้ชัดเจน อ่านออก และตรงตามภาษาอย่างมีนัยสำคัญ (เมนู โปสเตอร์ แผนภาพ) Nano Banana Pro ยกระดับการเรนเดอร์ข้อความในภาพไปอีกขั้น:

  • ข้อความในภาพชัดเจน อ่านง่าย และสะกดถูกต้อง
  • รองรับการสร้างหลายภาษา (รวมถึงภาษาจีน ญี่ปุ่น เกาหลี อาหรับ ฯลฯ)
  • อนุญาตให้ผู้ใช้เขียนย่อหน้ายาวหรือข้อความบรรยายหลายบรรทัดลงในภาพได้โดยตรง
  • รองรับการแปลและการปรับให้เข้ากับท้องถิ่นโดยอัตโนมัติ

เหตุผลที่สำคัญ: โดยทั่วไปโมเดลภาพมักมีปัญหาในการเรนเดอร์ข้อความให้อ่านได้และจัดวางได้ดี Nano Banana Pro ถูกปรับให้เหมาะกับการเรนเดอร์ข้อความและการแปลท้องถิ่นอย่างเชื่อถือได้โดยเฉพาะ (เช่น การแปลพร้อมคงเลย์เอาต์ไว้) ซึ่งปลดล็อกกรณีใช้งานเชิงสร้างสรรค์จริง เช่น โปสเตอร์ บรรจุภัณฑ์ หรือโฆษณาหลายภาษา

วิธีทำให้ได้ผล: การปรับปรุงด้านการเรนเดอร์ข้อความมาจากสถาปัตยกรรมมัลติโหมดพื้นฐานและการฝึกด้วยชุดข้อมูลที่เน้นตัวอย่างข้อความในภาพ ร่วมกับชุดประเมินผลเฉพาะทาง (การประเมินโดยมนุษย์และ regression sets) โมเดลเรียนรู้ที่จะจัดแนวรูปร่างของ glyph ฟอนต์ และข้อจำกัดด้านเลย์เอาต์ เพื่อสร้างข้อความที่อ่านได้และแปลตามท้องถิ่นภายในภาพ — แม้ว่าข้อความขนาดเล็กและย่อหน้าที่หนาแน่นมากยังคงมีโอกาสผิดพลาดได้

ความสม่ำเสมอของภาพและความคมชัดที่แข็งแกร่งขึ้น

การควบคุมระดับสตูดิโอ (แสง โฟกัส มุมกล้อง การเกรดสี) และการจัดองค์ประกอบจากหลายภาพ (รองรับภาพอ้างอิงสูงสุด 14 ภาพ พร้อมข้อยืดหยุ่นพิเศษสำหรับตัวแบบมนุษย์หลายคน) ช่วยรักษาความสม่ำเสมอของตัวละคร (คงบุคคล/ตัวละครเดิมไว้ตลอดการแก้ไข) และอัตลักษณ์ของแบรนด์ในสินทรัพย์ที่สร้างขึ้นหลายชิ้น โมเดลรองรับเอาต์พุตแบบเนทีฟที่ 1K/2K/4K

เหตุผลที่สำคัญ: เวิร์กโฟลว์ด้านการตลาดและบันเทิงต้องการตัวละครที่คงเส้นคงวาข้ามช็อตและการแก้ไขต่าง ๆ โมเดลสามารถรักษาความคล้ายได้สูงสุด ห้าคน และผสมภาพอ้างอิงได้สูงสุด 14 ภาพไว้ในองค์ประกอบเดียว พร้อมสร้างจาก Sketch → 3D Render ได้ สิ่งนี้มีประโยชน์สำหรับงานโฆษณา บรรจุภัณฑ์ หรือการเล่าเรื่องหลายช็อต

วิธีทำให้ได้ผล: อินพุตของโมเดลรับหลายภาพพร้อมการกำหนดบทบาทอย่างชัดเจน (เช่น “Image A: pose”, “Image B: face reference”, “Image C: background texture”) สถาปัตยกรรมจะทำ conditioning การสร้างจากภาพเหล่านั้น เพื่อคงอัตลักษณ์/ท่าทาง/สไตล์ ขณะใช้การแปลงต่าง ๆ (แสง กล้อง)

เกณฑ์วัดประสิทธิภาพของ Nano Banana Pro

Nano Banana Pro (Gemini 3 Pro Image) “โดดเด่นในเกณฑ์วัด AI แบบ Text→Image” และแสดงให้เห็นถึงการให้เหตุผลและการยึดโยงกับบริบทที่ดีขึ้นเมื่อเทียบกับ Nano Banana รุ่นก่อนหน้า โดยเน้นความคมชัดที่สูงขึ้นและการเรนเดอร์ข้อความที่ดีขึ้นเมื่อเทียบกับรุ่นก่อน

จะใช้ Nano Banana Pro(Gemini 3 Pro Image) API อย่างไร ?

แนวทางด้านประสิทธิภาพเชิงปฏิบัติ

คาดการณ์ได้ว่า เวลาแฝง และต้นทุนสำหรับการเรนเดอร์คุณภาพสูงระดับ 2K/4K จะสูงกว่า 1K หรือโมเดล “Flash” ที่ปรับให้เหมาะกับความเร็ว หาก throughput/latency มีความสำคัญ ให้ใช้รุ่น flash (เช่น Gemini 2.5 Flash / Nano Banana) สำหรับงานปริมาณมาก; ใช้ Nano Banana Pro / gemini-3-pro-image สำหรับงานที่ต้องการคุณภาพสูงและการให้เหตุผลที่ซับซ้อน

นักพัฒนาจะเข้าถึง Nano Banana Pro ได้อย่างไร?

ควรเลือก endpoint และโมเดลใด

ตัวระบุโมเดล (preview / pro): gemini-3-pro-image-preview (preview) — ใช้ตัวนี้เมื่อคุณต้องการความสามารถของ Nano Banana Pro สำหรับงานที่เร็วกว่าและต้นทุนต่ำกว่า gemini-2.5-flash-image (Nano Banana) ยังคงพร้อมใช้งาน

ช่องทางที่ใช้ได้

  • Gemini API (generativelanguage endpoint): คุณสามารถใช้คีย์ CometAPI เพื่อเข้าถึง xx ได้ CometAPI นำเสนอ API เดียวกันในราคาที่คุ้มกว่าบนเว็บไซต์ทางการ ใช้การเรียก Direct HTTP / SDK ไปที่ generateContent สำหรับการสร้างภาพ (ตัวอย่างด้านล่าง)
  • Google AI Studio: อินเทอร์เฟซเว็บสำหรับทดลองอย่างรวดเร็วและรีมิกซ์แอปเดโม
  • Vertex AI (enterprise): throughput แบบ provisioned, ตัวเลือกด้านบิลลิง (pay-as-you-go / enterprise tiers) และตัวกรองความปลอดภัยสำหรับงาน production ขนาดใหญ่ ใช้ Vertex เมื่อต้องการผสานเข้ากับ pipeline ขนาดใหญ่หรืองาน batch rendering

ระดับฟรีมีข้อจำกัดด้านการใช้งาน; หากเกินขีดจำกัดจะกลับไปใช้ Nano Banana ระดับ Plus/Pro/Ultra ให้ขีดจำกัดที่สูงกว่าและเอาต์พุตแบบไม่มีลายน้ำ แต่ Ultra สามารถใช้ในเครื่องมือวิดีโอ Flow และ Antigravity IDE ในโหมด 4K ได้

ฉันจะสร้างภาพด้วย Nano Banana Pro ได้อย่างไร (ทีละขั้นตอน)?

1) สูตรใช้งานแบบโต้ตอบอย่างรวดเร็วเพื่อใช้ Gemini app

  1. เปิด Gemini → Tools → Create images
  2. เลือก Thinking (Nano Banana Pro) เป็นโมเดล
  3. ป้อน prompt: อธิบายตัวแบบ การกระทำ อารมณ์ แสง มุมกล้อง อัตราส่วนภาพ และข้อความใด ๆ ที่ต้องการให้ปรากฏบนภาพ ตัวอย่าง:
    “Create a 4K poster of a robotics workshop: a diverse team around a table, blueprint overlay, bold headline ‘Robots in Action’ in sans serif, warm tungsten light, shallow depth of field, cinematic 16:9.”
  4. (ไม่บังคับ) อัปโหลดภาพได้สูงสุด 14 ภาพเพื่อผสานหรือใช้เป็นภาพอ้างอิง ใช้เครื่องมือเลือก/มาสก์เพื่อแก้ไขเฉพาะบริเวณ
  5. สร้างภาพ ปรับแก้ด้วยภาษาธรรมชาติ (เช่น “make the headline blue and aligned top-center; increase contrast on the blueprint”) จากนั้นส่งออก

2) ใช้ HTTP เพื่อส่งไปยัง Gemini image endpoint

คุณต้องเข้าสู่ระบบ CometAPI เพื่อรับคีย์

# save your API key to $CometAPI_API_KEY securely before running

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "role": "user",
      "parts": [{
        "text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
      }]
    }],
    "generationConfig": {
      "imageConfig": {
        "resolution": "4096x4096",
        "aspectRatio": "1:1"
      }
    }
  }' \
  | jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
  | base64 --decode > nano_banana_pro_4k.png

ตัวอย่างนี้จะเขียน payload ภาพแบบ base64 ลงในไฟล์ PNG พารามิเตอร์ generationConfig.imageConfig.resolution ใช้สำหรับขอเอาต์พุตระดับ 4K (มีให้ใช้ในโมเดล 3 Pro Image)

3) เรียกใช้ generateContent โดยตรงผ่าน SDK สำหรับการสร้างภาพ

ต้องติดตั้ง Google SDK และรับการยืนยันตัวตนของ Google ตัวอย่าง Python (ข้อความ + ภาพอ้างอิง + grounding):

# pip install google-genai pillow

from google import genai
from PIL import Image
import base64

client = genai.Client()  # reads credentials from env / config per SDK docs

# Read a reference image and set inline_data

with open("ref1.png", "rb") as f:
    ref1_b64 = base64.b64encode(f.read()).decode("utf-8")

prompt_parts = [
    {"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
    {"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,
    generation_config={
        "imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
        # tools can be provided to ground facts, e.g. "google_search"

        "tools": 
    }
)

for part in response.candidates.content.parts:
    if part.inline_data:
        image = part.as_image()
        image.save("product_ad.png")

ตัวอย่างนี้แสดงการอัปโหลดภาพอ้างอิงแบบ inline และการร้องขอองค์ประกอบระดับ 4K พร้อมเปิดใช้ google_search เป็นเครื่องมือ Python SDK จะจัดการรายละเอียด REST ระดับล่างให้

การผสานหลายภาพและความสม่ำเสมอของตัวละคร

หากต้องการสร้างภาพคอมโพสิตที่คงบุคคลเดิมไว้ข้ามฉาก ให้ส่ง inline_data หลายรายการ (เลือกจากชุดภาพของคุณ) และระบุคำสั่งเชิงสร้างสรรค์ว่าโมเดลควร “preserve identity across outputs”

ตัวอย่างใช้งานสั้น ๆ — prompt จริงและโฟลว์ที่คาดหวัง

Prompt:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."

Pipeline ที่คาดหวัง: app → prompt template + ข้อมูล CSV → แทนที่ placeholder ใน prompt → เรียก API ด้วย image_size=2048x1152 → รับ base64 PNG → บันทึก asset + provenance metadata → หากจำเป็นอาจซ้อนฟอนต์ที่แม่นยำด้วย compositor เพิ่มเติม

ฉันควรออกแบบ production pipeline และจัดการเรื่องความปลอดภัย / provenance อย่างไร?

สถาปัตยกรรม production ที่แนะนำ

  1. Prompt + draft pass (โมเดลเร็ว): ใช้ gemini-2.5-flash-image (Nano Banana) เพื่อสร้างตัวเลือกจำนวนมากที่ความละเอียดต่ำในต้นทุนที่ประหยัด
  2. การคัดเลือกและปรับแต่ง: เลือก candidate ที่ดีที่สุด ปรับแต่ง prompt และใช้ inpainting/การแก้ไขด้วยมาสก์เพื่อความแม่นยำ
  3. การเรนเดอร์สุดท้ายความคมชัดสูง: เรียก gemini-3-pro-image-preview (Nano Banana Pro) สำหรับเรนเดอร์สุดท้ายระดับ 2K/4K และ postprocessing (upsampling, color grade)
  4. Provenance และ metadata: จัดเก็บ prompt, เวอร์ชันโมเดล, timestamp และข้อมูล SynthID ในระบบเก็บ metadata ของ asset — โมเดลจะติดลายน้ำ SynthID และสามารถย้อนรอยเอาต์พุตกลับมาเพื่อการปฏิบัติตามข้อกำหนดและการตรวจสอบเนื้อหาได้

ความปลอดภัย สิทธิ์ และการกลั่นกรอง

  • ลิขสิทธิ์และการเคลียร์สิทธิ์: อย่าอัปโหลดหรือสร้างเนื้อหาที่ละเมิดสิทธิ์ ใช้การยืนยันจากผู้ใช้อย่างชัดเจนสำหรับภาพหรือ prompt ที่ผู้ใช้ส่งเข้ามาซึ่งอาจสร้างภาพเหมือนของบุคคลที่จดจำได้ ต้องปฏิบัติตามนโยบายการใช้งานต้องห้ามของ Google และตัวกรองความปลอดภัยของโมเดล
  • การกรองและการตรวจสอบอัตโนมัติ: นำภาพที่สร้างแล้วเข้าสู่ pipeline กลั่นกรองเนื้อหาภายใน (NSFW, สัญลักษณ์ความเกลียดชัง, การตรวจจับเนื้อหาทางการเมือง/ที่มีผลผูกพัน) ก่อนใช้งานต่อหรือแสดงผลสู่สาธารณะ

ฉันจะทำ image editing (inpainting), การผสานหลายภาพ และการเรนเดอร์ข้อความได้อย่างไร?

Nano Banana Pro รองรับเวิร์กโฟลว์การแก้ไขแบบมัลติโหมด: ระบุภาพนำเข้าหนึ่งภาพหรือหลายภาพพร้อมคำสั่งข้อความที่อธิบายการแก้ไข (ลบวัตถุ เปลี่ยนท้องฟ้า เพิ่มข้อความ) API รับภาพ + ข้อความในคำขอเดียวกัน; โมเดลสามารถสร้างข้อความและภาพสลับกันในผลลัพธ์ได้ รูปแบบตัวอย่างรวมถึงการแก้ไขด้วยมาสก์และการผสมหลายภาพ (style transfer / composition) โปรดดูเอกสารสำหรับ contents arrays ที่รวม text blobs และ binary images เข้าด้วยกัน

ตัวอย่าง: แก้ไข (Python pseudo-flow)

from google import genai
from PIL import Image

client = genai.Client()

prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"

# contents can include Image objects or binary data per SDK; see doc for exact call

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,  # order matters: image + instruction

)
# Save result as before

การแก้ไขแบบสนทนานี้ช่วยให้คุณค่อย ๆ ปรับผลลัพธ์จนได้ asset ที่พร้อมใช้งานจริง

ตัวอย่าง Node.js — แก้ไขภาพด้วย mask และภาพอ้างอิงหลายภาพ

// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');

const auth = new GoogleAuth({ scopes:  });
async function runEdit() {
  const client = await auth.getClient();
  const token = await client.getAccessToken();
  const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
  const MODEL = "gemini-3-pro-image";

  // Attach binary image content or URLs depending on API.
  const payload = {
    model: MODEL,
    prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
    inputs: {
      referenceImages: [
        { uri: "gs://my-bucket/photo_subject.jpg" },
        { uri: "gs://my-bucket/target_studio.jpg" }
      ],
      mask: { uri: "gs://my-bucket/mask.png" },
      imageConfig: { resolution: "2048x2048", format: "png" }
    },
    options: { preserveIdentity: true }
  };

  const res = await fetch(API_URL, {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${token.token}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify(payload)
  });
  const out = await res.json();
  console.log(JSON.stringify(out, null, 2));
}
runEdit();

(บางครั้ง API อาจรับ Cloud Storage URI หรือ payload ภาพแบบ base64; โปรดตรวจสอบเอกสาร Gemini API สำหรับรูปแบบอินพุตที่แน่นอน)

สำหรับข้อมูลเกี่ยวกับการสร้างและแก้ไขภาพโดยใช้ CometAPI โปรดดูที่ Guide to calling gemini-3-pro-image .

บทสรุป

Nano Banana Pro (Gemini 3 Pro Image) คือก้าวกระโดดระดับ production ในการสร้างภาพ: เป็นเครื่องมือสำหรับการทำให้ข้อมูลมองเห็นได้ การสร้างการแก้ไขแบบ localized และการขับเคลื่อนเวิร์กโฟลว์ของนักพัฒนา ใช้แอป Gemini สำหรับการสร้างต้นแบบอย่างรวดเร็ว ใช้ API สำหรับการผสานเข้ากับระบบ production และปฏิบัติตามคำแนะนำข้างต้นเพื่อควบคุมต้นทุน รักษาความปลอดภัย และคงคุณภาพของแบรนด์ ควรทดสอบกับเวิร์กโฟลว์ของผู้ใช้จริงเสมอ และจัดเก็บ provenance metadata เพื่อให้เป็นไปตามข้อกำหนดด้านความโปร่งใสและการตรวจสอบย้อนหลัง

ใช้ Nano Banana Pro เมื่อคุณต้องการ asset คุณภาพระดับสตูดิโอ การควบคุมองค์ประกอบอย่างแม่นยำ การเรนเดอร์ข้อความในภาพที่ดีขึ้น และความสามารถในการผสานภาพอ้างอิงหลายภาพให้เป็นเอาต์พุตที่สอดคล้องกันหนึ่งชิ้น

นักพัฒนาสามารถเข้าถึง Gemini 3 Pro Image( Nano Banana Pro) API ผ่าน CometAPI ได้ หากต้องการเริ่มต้น ให้สำรวจความสามารถของโมเดลของ CometAPI ใน Playground และศึกษา API guide สำหรับคำแนะนำโดยละเอียด ก่อนเข้าถึง โปรดตรวจสอบว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับ API key แล้ว CometAPI เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยให้คุณผสานระบบได้ง่ายขึ้น

พร้อมเริ่มใช้งานหรือยัง?→ สมัครใช้งาน CometAPI วันนี้ !

หากคุณต้องการทราบเคล็ดลับ คู่มือ และข่าวสารเกี่ยวกับ AI เพิ่มเติม ติดตามเราได้ที่ VK, X และ Discord!

เข้าถึงโมเดลชั้นนำ ด้วยต้นทุนต่ำ

อ่านเพิ่มเติม