ภาพรวม API ของ Nano Banana 2 Lite
Nano Banana 2 Lite API ซึ่งมีชื่ออย่างเป็นทางการว่า gemini-3.1-flash-lite-image คือโมเดลภาพ Gemini 3.1 ของ Google ที่มุ่งเน้นประสิทธิภาพสำหรับงานสร้างและแก้ไขภาพปริมาณสูง Google เรียกโมเดลนี้ว่า Gemini 3.1 Flash Lite Image บน CometAPI นักพัฒนาสามารถเข้าถึงโมเดลผ่านเส้นทางเนทีฟของ Gemini คือ generateContent ทำให้เหมาะกับการร่างภาพ 1K อย่างรวดเร็ว การแก้ไขภาพอย่างง่าย เครื่องมือครีเอทีฟแบบโต้ตอบ ภาพหน้าปกย่อ ทรัพย์สินสำหรับโซเชียล และเวิร์กโฟลว์การผลิตที่ให้ความสำคัญกับความเร็วและการควบคุมต้นทุนมากกว่าความละเอียดสูงสุด
ข้อมูลทางเทคนิค
| รายการ | ข้อมูลจำเพาะ |
|---|---|
| ชื่อโมเดล | Nano Banana 2 Lite / Gemini 3.1 Flash Lite Image |
| API model ID | gemini-3.1-flash-lite-image |
| รหัสโมเดลใน CometAPI | gemini-3-1-flash-lite-image |
| ผู้ให้บริการ | |
| ประเภทโมเดล | การสร้างและแก้ไขภาพ |
| คุณสมบัติในแคตตาล็อก CometAPI | text-to-image |
| รูปแบบอินพุตที่รองรับ | ข้อความและภาพ |
| รูปแบบเอาต์พุตที่รองรับ | ภาพและข้อความ |
| Endpoint บน CometAPI | POST /v1beta/models/{model}:generateContent |
| Stable model ID | gemini-3.1-flash-lite-image |
| ขีดจำกัดโทเค็นขาเข้า | 65,536 tokens |
| ขีดจำกัดโทเค็นขาออก | 4,096 tokens |
| ความละเอียดเอาต์พุต | 1K / 1024px only |
| อัตราส่วนภาพที่รองรับ | 14 อัตราส่วน รวมถึง 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| Thinking | รองรับ; ขั้นต่ำและสูง |
Nano Banana 2 Lite คืออะไร?
Nano Banana 2 Lite เป็นสมาชิกในตระกูลโมเดลภาพ Gemini ของ Google ที่เน้นความเร็วและประสิทธิภาพ หน้าโมเดลของ Google อธิบายว่าเป็นผู้เชี่ยวชาญด้านประสิทธิภาพสำหรับการสร้างและปรับแต่งภาพที่มีค่าเวลาแฝงต่ำมากและคุ้มค่า
การแลกเปลี่ยนนี้ตั้งใจไว้: Nano Banana 2 Lite เล็งเป้าไปที่เอาต์พุต 1K และการใช้งานแบบโต้ตอบปริมาณสูงมากกว่าความเที่ยงตรงสูงสุด Google ระบุว่าเอาต์พุต 2K และ 4K ไม่รองรับสำหรับรุ่น Lite นี้ และคู่มือการสร้างภาพระบุว่าไม่ได้ปรับให้เหมาะกับอินพุตอ้างอิงหลายรายการหรือการแก้ไขต่อเนื่องหลายรอบ ทำให้เหมาะอย่างยิ่งสำหรับการร่างอย่างรวดเร็วและการแก้ไขเบาๆ ในขณะที่ Gemini 3.1 Flash Image และ Nano Banana Pro เหมาะกว่าสำหรับงานผลิตที่ต้องการความละเอียดสูงหรือการอ้างอิงจำนวนมาก
คุณสมบัติหลักของ Nano Banana 2 Lite API
1. เวลาแฝงต่ำมากสำหรับเวิร์กโฟลว์ภาพแบบโต้ตอบ
Google วางตำแหน่ง Nano Banana 2 Lite ให้เป็นผู้เชี่ยวชาญด้านประสิทธิภาพของตระกูลภาพ Gemini การ์ดโมเดลอย่างเป็นทางการระบุว่าเล็งเป้า เวลาแฝงปลายทางถึงปลายทางต่ำกว่า 2 วินาที ในขณะที่โพสต์เปิดตัวของ Google ชี้ว่าการแปลงข้อความเป็นภาพทำได้ราว 4 วินาทีเพื่อการร่างที่รวดเร็วในทางปฏิบัติ ในสภาพการผลิต เวลาแฝงจริงจะขึ้นกับความซับซ้อนของพรอมป์ ขนาดภาพอินพุต เส้นทางเครือข่าย รูปแบบการตอบกลับ และเงื่อนไขการเราต์ของ CometAPI แต่โมเดลนี้ชัดเจนว่าถูกออกแบบมาสำหรับรอบข้อเสนอแนะที่รวดเร็วมากกว่าการเรนเดอร์ออฟไลน์ที่ความละเอียดสูงสุด
สิ่งนี้ทำให้ Nano Banana 2 Lite มีประโยชน์เป็นพิเศษสำหรับผู้สร้างแอปแบบโต้ตอบ: อินเทอร์เฟซที่สร้างภาพขณะผู้ใช้พิมพ์ ระบบภาพหน้าปกย่อปริมาณมาก พรีวิวเกมหรืออวตาร การสำรวจเวอร์ชันโฆษณา การสร้างภาพแทนในอีคอมเมิร์ซ และเครื่องมือครีเอทีฟที่ผู้ใช้อาจขอทำซ้ำย่อยๆ หลายสิบครั้งก่อนอนุมัติทิศทางสุดท้าย
2. การสร้างภาพจากข้อความและจากภาพแบบเนทีฟ
Nano Banana 2 Lite รองรับทั้งอินพุตข้อความและภาพ และสามารถส่งคืนเอาต์พุตเป็นภาพและข้อความ ผ่านเส้นทาง Gemini ของ CometAPI นักพัฒนาสามารถส่งพรอมป์ข้อความเพียงอย่างเดียวเพื่อสร้างภาพจากข้อความโดยตรง หรือผสมภาพอินพุตกับคำสั่งข้อความเพื่อแก้ไขภาพต่อภาพ
เนื่องจากใช้เวิร์กโฟลว์ภาพเนทีฟของ Gemini โมเดลจึงไม่จำกัดแค่รูปแบบ “ป้อนพรอมป์แล้วได้รูปภาพ” เท่านั้น มันสามารถอ่านบริบทภาพของผู้ใช้ ปรับแต่งเฉพาะจุด สร้างภาพใหม่ และเพิ่มข้อความในคำตอบได้ตามต้องการ รูปแบบนี้เหมาะกับเครื่องมือจำลองผลิตภัณฑ์ การเปลี่ยนพื้นหลัง การถ่ายโอนสไตล์อย่างรวดเร็ว เวอร์ชันแคมเปญที่แปลท้องถิ่น และภาพพรีวิวในแอปสำหรับผู้บริโภค
3. การแก้ไขภาพแบบหลายรอบในพื้นที่ที่รวดเร็ว
การ์ดโมเดลของ Google ระบุความสามารถด้านการแก้ไขแบบหลายรอบในพื้นที่ที่รวดเร็ว รวมถึงตัวอย่างเช่น การสลับสี การสร้างสติกเกอร์ และการปรับพื้นหลัง ในทางปฏิบัติ ผู้ใช้สามารถขอภาพแรก แล้วต่อด้วยคำสั่งเพิ่มเติมอย่าง “ทำให้แจ็กเก็ตเป็นสีแดง” “เปลี่ยนให้เป็นสติกเกอร์” หรือ “แทนที่พื้นหลังด้วยผนังสตูดิโอที่สะอาด”
อย่างไรก็ตาม ข้อจำกัดก็สำคัญ: คู่มือการสร้างภาพของ Google ระบุว่า Nano Banana 2 Lite ไม่ได้ปรับให้เหมาะกับอินพุตอ้างอิงหลายรายการหรือการแก้ไขต่อเนื่องหลายรอบ ใช้รุ่น Lite สำหรับการแก้ไขเฉพาะจุดที่รวดเร็วและการสำรวจแบบสนทนา หากต้องการรองรับอ้างอิงจำนวนมาก โซ่การแก้ไขที่ยาวขึ้น หรือการควบคุมเลย์เอาต์ในระดับมืออาชีพ ให้ย้ายไปใช้ Nano Banana 2 หรือ Nano Banana Pro
4. การยึดตามพรอมป์อย่างแม่นยำและความสอดคล้องของตัวละครที่แข็งแกร่ง
Google ระบุว่า Nano Banana 2 Lite รักษาการควบคุมและความแม่นยำแบบเดียวกับ Nano Banana ขณะเร่งประสบการณ์ การสื่อสารอย่างเป็นทางการชี้ให้เห็นความน่าเชื่อถือในการยึดตามพรอมป์ ความสม่ำเสมอของตัวละครสูง และการจัดแนวตัวละครอย่างแข็งแกร่ง ตามมาตรฐานเดิมของ Nano Banana
สิ่งนี้ทำให้โมเดลมีประโยชน์กว่าตัวสร้างภาพแบบรวดเร็วทั่วไป สำหรับการสำรวจครีเอทีฟซ้ำๆ โมเดลต้องรักษาหัวเรื่องที่ตั้งใจไว้ ทิศทางสี ท่าทาง ฉาก สัญญาณแบรนด์ และอัตลักษณ์ตัวละครให้คงอยู่ระหว่างเวอร์ชันต่างๆ Nano Banana 2 Lite ถูกออกแบบมาเพื่อกรณี “ทำซ้ำอย่างรวดเร็วโดยไม่ทำไอเดียหาย”
5. การเรนเดอร์ข้อความในภาพที่ดีขึ้น
โพสต์เปิดตัวของ Google ระบุว่า Nano Banana 2 Lite ยังคงความสามารถในการเรนเดอร์ข้อความที่อ่านได้ภายในภาพ แม้จะให้ความสำคัญกับความเร็ว สิ่งนี้สำคัญสำหรับภาพหน้าปกย่อ โปสเตอร์ง่ายๆ คอนเซ็ปต์ UI ป้ายฉลาก สติกเกอร์ และกราฟิกการตลาดแบบเบาๆ ที่ต้องมีคำหรือวลีสั้นๆ ปรากฏในภาพที่สร้างขึ้น
สำหรับอินโฟกราฟิกที่มีข้อความหนาแน่น เลย์เอาต์หลายภาษา หน้าสไตล์นิตยสาร บรรจุภัณฑ์สินค้า หรือการจัดวางตัวอักษรที่ละเอียดอ่อน Nano Banana 2 และ Nano Banana Pro เป็นตัวเลือกที่ดีกว่า คู่มือการสร้างภาพของ Google จัดวาง Nano Banana 2 เป็นโมเดลสายงานทั่วไปที่เรนเดอร์ข้อความได้อย่างน่าเชื่อถือ ในขณะที่ Nano Banana Pro เป็นตัวเลือกมืออาชีพสำหรับข้อความที่แม่นยำและเลย์เอาต์ที่ซับซ้อน
6. เอาต์พุต 1K พร้อมรองรับอัตราส่วนภาพที่หลากหลาย
Nano Banana 2 Lite ถูกปรับให้เหมาะกับเอาต์พุต 1K โดยการ์ดโมเดลของ Google ระบุขนาดภาพที่รองรับเป็น 1024px / 1K และบอกว่าไม่รองรับ 2K และ 4K รองรับอัตราส่วนภาพทั่วไป รวมถึงสี่เหลี่ยมจัตุรัส แนวตั้ง แนวนอน รูปแบบแนวตั้งสำหรับโซเชียล และเลย์เอาต์อัลตร้าไวด์
สำหรับการผลิต ให้กำหนด imageConfig.aspectRatio และ imageConfig.imageSize อย่างชัดเจน และใช้ 1K ตัวพิมพ์ใหญ่หรือค่าที่รองรับคือ 1024px หากเวิร์กโฟลว์ของคุณต้องการ 2K, 4K, พรีวิวยูทิลิตี้ 0.5K หรือเอาต์พุตสำหรับงานพิมพ์และออกแบบที่มีความเที่ยงตรงสูงกว่า ให้ใช้ Nano Banana 2 หรือ Nano Banana Pro แทน
ผลการทดสอบมาตรฐานของ Nano Banana 2 Lite
ตามกระดานจัดอันดับสาธารณะของ Arena.ai ลงวันที่ 29 มิถุนายน 2026 gemini-3.1-flash-lite-image เป็นโมเดลที่มีประสิทธิภาพสูง ไม่ใช่เพียง “รุ่นร่างราคาถูก”: ได้คะแนนใกล้เคียงกับโมเดลภาพ Gemini ที่หนักกว่าในการสร้าง และยังคงแข่งขันได้ในการแก้ไขภาพเดี่ยว ในขณะที่ให้ความสำคัญกับเวลาแฝงที่ต่ำกว่ามาก
| Benchmark | คะแนน Nano Banana 2 Lite | สัญญาณอันดับ Arena.ai | โหวต | ความหมาย |
|---|---|---|---|---|
| Text-to-Image Arena, Overall | 1251 +/- 8 | อันดับ 5 จาก 70 โมเดล | 5,462 | คุณภาพการสร้างภาพจากผู้ใช้สาธารณะที่แข็งแกร่งสำหรับรุ่น Lite อยู่ต่ำกว่า mai-image-2.5 และ Nano Banana 2 เล็กน้อย และเหนือกว่า 2K Nano Banana Pro preview ในสแนปชอตนี้ |
| Image Edit Arena, Single-Image Edit | 1308 +/- 7 | อันดับ 15 จาก 49 โมเดล | 9,320 | คุณภาพการแก้ไขที่แข่งขันได้ อยู่หลังโมเดลภาพเรือธงที่หนักกว่าแต่เหนือกว่าบรรณาธิการภาพทั่วไปจำนวนมาก |
วิธีเลือก: Nano Banana 2 Lite vs Nano Banana 2 vs Nano Banana Pro
ตระกูลภาพ Nano Banana ของ Google ถูกแบ่งระดับตามความเร็ว คุณภาพ และการควบคุม Nano Banana 2 Lite เป็นโมเดลที่รวดเร็วและประหยัดสำหรับการสร้างภาพ 1K ปริมาณสูง Nano Banana 2 เป็นม้าทำงานสายทั่วไปสำหรับการสร้างและแก้ไขภาพคุณภาพสูงที่จัดการอ้างอิงได้ดีกว่า และรองรับเอาต์พุตสูงสุดถึง 4K Nano Banana Pro เป็นรุ่นพรีเมียมสำหรับงานออกแบบที่ซับซ้อน ความแม่นยำของแบรนด์ การแปลขั้นสูง และการควบคุมครีเอทีฟที่ละเอียด
กระดานจัดอันดับ text-to-image จัดวาง gemini-3.1-flash-lite-image (nano-banana-2-lite) ใกล้กับคู่แข่งระดับพรีเมียมหลายราย: gemini-3.1-flash-image-preview (nano-banana-2) ได้ 1270 +/- 4, mai-image-2.5 ได้ 1257 +/- 5, gemini-3-pro-image-preview-2k (nano-banana-pro) ได้ 1245 +/- 4 และ gpt-image-1.5-high-fidelity ได้ 1241 +/- 3 กระดานจัดอันดับการแก้ไขภาพมีความท้าทายมากกว่าสำหรับ Lite: gpt-image-2 (medium) นำด้วย 1464 +/- 4 ขณะที่ Nano Banana 2 Lite ที่ 1308 +/- 7 อยู่ต่ำกว่ากลุ่มเรือธงแต่ยังอยู่ในกลุ่มบนที่แข่งขันได้
| โมเดล | ผู้ให้บริการ | งานที่เหมาะสมที่สุด | สัญญาณจากเบนช์มาร์กสาธารณะ |
|---|---|---|---|
| Nano Banana 2 Lite (gemini-3.1-flash-lite-image) | การสร้างภาพ 1K ที่รวดเร็ว การแก้ไขเบาๆ ร่างปริมาณสูง ประสบการณ์ผลิตภัณฑ์แบบโต้ตอบ | 1251 +/- 8 บน Arena.ai Text-to-Image Overall; 1308 +/- 7 บน Arena.ai Single-Image Edit | |
| Nano Banana 2 / Gemini 3.1 Flash Image | การสร้างภาพ Gemini 3.1 คุณภาพสูงขึ้น งานอ้างอิงหลายแหล่งที่แข็งแรงกว่า เวิร์กโฟลว์ 2K/4K | 1270 +/- 4 บน Arena.ai Text-to-Image Overall; 1387 +/- 4 บน Arena.ai Single-Image Edit | |
| Nano Banana Pro / Gemini 3 Pro Image | องค์ประกอบที่ซับซ้อนยิ่งขึ้น บริบทที่เข้มข้นขึ้น และงานผลิตความละเอียดสูง | 1245 +/- 4 สำหรับพรีวิว 2K บน Arena.ai Text-to-Image Overall; 1388 +/- 3 สำหรับพรีวิว 2K บน Arena.ai Single-Image Edit | |
| GPT Image 2 | OpenAI | การสร้างและแก้ไขระดับพรีเมียมที่ให้ความสำคัญกับคุณภาพสูงสุดจากเบนช์มาร์กมากกว่าค่าเวลาแฝงแบบ Lite | นำในสแนปชอตของ Arena.ai ที่อ้างถึงด้วย 1387 +/- 5 ใน Text-to-Image และ 1464 +/- 4 ใน Single-Image Edit |
เลือกใช้ Nano Banana 2 Lite เมื่อต้องให้ประสบการณ์ผลิตภัณฑ์ขึ้นกับความเร็ว การควบคุมต้นทุน และการทำซ้ำบ่อยๆ เหมาะที่สุดสำหรับ UX เกือบเรียลไทม์ การสร้างร่าง และการแก้ไขเบาๆ ที่ 1K
เลือกใช้ Nano Banana 2 เมื่อต้องการค่าเริ่มต้นที่ปลอดภัยสำหรับคุณภาพภาพ เอาต์พุต 4K อ้างอิงหลายรายการ การเรนเดอร์ข้อความที่แข็งแกร่งขึ้น และสมดุลระหว่างคุณภาพกับความหน่วงที่ดีกว่า เหมาะเป็นตัวเลือกทั่วไปสำหรับเวิร์กโฟลว์ภาพในการผลิตส่วนใหญ่
เลือกใช้ Nano Banana Pro เมื่องานใกล้กับการผลิตงานออกแบบมากกว่าการสร้างอย่างรวดเร็ว: โฆษณาแบรนด์ ม็อกอัปผลิตภัณฑ์ องค์ประกอบหลายส่วน การแปลเนื้อหาที่ซับซ้อน ไทโปกราฟีที่ละเอียด อินโฟกราฟิกที่ซับซ้อน หรือทรัพย์สินที่ต้องการความรู้เกี่ยวกับโลกและการควบคุมครีเอทีฟระดับสูงสุด
วิธีใช้งาน Nano Banana 2 Lite API บน CometAPI
ขั้นตอนที่ 1: สมัครรับ API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ CometAPI ให้ลงทะเบียนก่อน จากนั้นเปิดหน้า CometAPI console token ในศูนย์ส่วนบุคคล คลิก Add Token ใต้การจัดการโทเค็น API สร้างข้อมูลรับรองการเข้าถึง และคัดลอกคีย์โทเค็นในรูปแบบ sk-xxxxx
เก็บ API key นี้ไว้เป็นความลับ และใช้งานจากบริการแบ็กเอนด์หรือค่าตัวแปรสภาพแวดล้อมในเครื่องของคุณ ในตัวอย่างด้านล่าง ให้แทนที่ <YOUR_API_KEY> หรือ $COMETAPI_KEY ด้วย CometAPI key จริงจากบัญชีของคุณ
ขั้นตอนที่ 2: ส่งคำขอไปยัง Nano Banana 2 Lite API
เลือก endpoint ของโมเดล gemini-3.1-flash-lite-image สำหรับ Nano Banana 2 Lite คำขอถูกส่งผ่านเส้นทางภาพของ Gemini บน CometAPI:
POST https://api.cometapi.com/v1beta/models/gemini-3.1-flash-lite-image:generateContent
ใช้วิธีการเรียกและโครงสร้างบอดีคำขอตามเอกสาร CometAPI Gemini image ดูตำแหน่งที่เรียกได้ที่: Gemini generates image เส้นทางเดียวกันรองรับการสร้างภาพจากข้อความ การแก้ไขภาพ และเวิร์กโฟลว์หลายภาพ แต่ตัว Nano Banana 2 Lite เองถูกปรับเพื่อเอาต์พุต 1K ที่รวดเร็ว มากกว่าจะรองรับ 2K/4K หรือการแก้ไขต่อเนื่องที่ซับซ้อนยาว
สำหรับ text-to-image ให้ส่งพรอมป์ข้อความใน contents.parts.text และตั้งค่า generationConfig.responseModalities ให้รวม IMAGE สำหรับการแก้ไขภาพ ให้ส่งภาพอินพุตตามคู่มือของ CometAPI เช่น ผ่าน Google Gen AI SDK หรือส่งข้อมูลภาพดิบในรูปแบบ Gemini ที่ระบุ แล้วเพิ่มคำสั่งแก้ไขเป็นข้อความ สำหรับเวิร์กโฟลว์หลายภาพ ให้อัปโหลดหรือเตรียมภาพต้นทางก่อน แล้วปฏิบัติตามเอกสารปัจจุบันสำหรับอินพุตภาพที่รองรับและข้อจำกัดเฉพาะของโมเดล
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับ API เพื่อรับภาพที่สร้างขึ้น การตอบกลับภาพของ Gemini อาจมีส่วนข้อความ ส่วนภาพสุดท้าย และบางครั้งมีส่วนภาพระหว่างทางที่ถูกทำเครื่องหมายด้วย thought: true อย่าบันทึกภาพแรกโดยไม่ตรวจสอบ ให้ข้ามส่วนที่เป็น thought: true และบันทึกส่วนภาพสุดท้ายที่เหลืออยู่ซึ่งมี inlineData และ thought ไม่เป็นจริง
ใน CometAPI playground คุณสามารถดาวน์โหลดภาพที่สร้างได้โดยตรง โดยปกติจะเป็นรูปแบบ PNG ในเวิร์กโฟลว์ API ให้ถอดรหัสและจัดเก็บภาพที่ส่งคืนใน inlineData หรือดาวน์โหลด URL ของผลลัพธ์ที่สร้างขึ้นหากเวิร์กโฟลว์ที่คุณเลือกบน CometAPI ส่งคืนแบบนั้น ดาวน์โหลดหรือบันทึกทรัพย์สินที่สร้างขึ้นโดยเร็ว จากนั้นตรวจสอบภาพสุดท้ายสำหรับความละเอียด การยึดตามพรอมป์ อาร์ติแฟกต์ที่มองเห็น ข้อกำหนดด้านความปลอดภัย และตรวจสอบว่าเป็นผลลัพธ์สุดท้ายไม่ใช่ภาพระหว่างการคิด
ทำไมต้องใช้ CometAPI สำหรับ Nano Banana 2 Lite?
CometAPI มีประโยชน์เมื่อทีมต้องการบัญชีเดียวและเลเยอร์การเราต์เดียวสำหรับโมเดลภาพหลายตัว ด้วย Nano Banana 2 Lite บน CometAPI ทีมสามารถสร้างภาพ Gemini ที่ 1K ได้อย่างรวดเร็ว เปรียบเทียบเอาต์พุตกับ Gemini 3.1 Flash Image, Nano Banana Pro, Imagen, Flux, เส้นทางสไตล์ Midjourney และโมเดลภาพอื่นๆ จากนั้นเราต์งานตามโปรไฟล์คุณภาพ เวลาแฝง และต้นทุน
แคตตาล็อกโมเดลของ CometAPI ยังแสดง ID โมเดลปัจจุบัน ผู้ให้บริการ ธงคุณสมบัติ ความพร้อมใช้งาน และเส้นทาง endpoint ช่วยลดความไม่ชัดเจนในการบูรณาการสำหรับแอปผลิตที่ต้องการการสลับโมเดล กลไกสำรอง การติดตามการใช้งาน และการจัดการข้อมูลรับรองที่สอดคล้องกัน