ข้อมูลจำเพาะทางเทคนิคของ Gemini 3.1 Flash Image Preview
| รายการ | Gemini 3.1 Flash Image Preview |
|---|---|
| ผู้ให้บริการ | |
| ตระกูลโมเดล | Gemini 3.1 (ระดับ Flash) |
| โฟกัสหลัก | การสร้างแบบมัลติโหมดความเร็วสูงพร้อมพรีวิวภาพ |
| ประเภทอินพุต | ข้อความ, รูปภาพ |
| ประเภทเอาต์พุต | ข้อความ, รูปภาพ (การสร้างพรีวิว) |
| หน้าต่างบริบท | สูงสุด 1M โทเค็น (มาตรฐานระดับ Flash ของ Gemini 3.x) |
| ระดับความหน่วง | ความหน่วงต่ำ อัตราการประมวลผลสูง |
| รองรับการสตรีมมิง | ใช่ |
| การเรียกใช้เครื่องมือ | ใช่ (กรอบงานเครื่องมือ Gemini API) |
| เวอร์ชัน | 3.1 |
Nano Banana 2 คืออะไร
Nano Banana 2 คือชื่อเล่นที่สื่อมวลชนและชุมชนนักพัฒนาใช้เรียกโมเดล Gemini-3.1-Flash-Image ที่เพิ่งเปิดตัว Google จัดวางตำแหน่งให้เป็นเอนจินภาพระดับ “Flash” ที่มอบความเที่ยงตรงด้านภาพใกล้เคียงระดับ Pro ในระดับความหน่วงและต้นทุนที่ต่ำกว่ามาก — เหมาะสำหรับการสร้างจำนวนมาก การแก้ไขแบบวนซ้ำอย่างรวดเร็ว และเวิร์กโฟลว์ผลิตภัณฑ์แบบบูรณาการทั่วบริการของ Google โมเดลนี้สืบทอดความสามารถในการให้เหตุผลแบบมัลติโหมดของ Gemini 3.1 และเพิ่มความสามารถที่เน้นภาพ (ตัวอักษรในภาพที่อ่านได้ องค์ประกอบภาพหลายภาพ การรองรับอัตราส่วนกว้าง และ 4K แบบเนทีฟ)
คุณสมบัติหลัก
- การสร้างความเร็วสูงหลายความละเอียด: ความเร็วระดับ Flash พร้อมตัวเลือกเอาต์พุต 0.5K / 1K / 2K / 4K และอัตราส่วนสุดขั้วแบบใหม่ (1:4, 4:1, 1:8, 8:1)
- การยึดโยงเว็บแบบเรียลไทม์: ผสานผลการค้นหาทั้งข้อความและรูปภาพเพื่อยึดโยงเนื้อหาที่สร้างกับข้อมูลบนเว็บปัจจุบันเมื่อเปิดใช้งาน “Thinking” หรือการยึดโยงด้วยการค้นหา มีประโยชน์สำหรับข้อมูลอ้างอิงที่เป็นปัจจุบันและอินโฟกราฟิกเชิงข้อเท็จจริง
- การเรนเดอร์ข้อความที่ดีขึ้น: การเรนเดอร์ข้อความสั้นและข้อความกราฟิก (ฟอนต์ ขนาด) ดีขึ้นกว่ารุ่น Flash ก่อนหน้า; ยังไม่สมบูรณ์กับย่อหน้ายาว/ข้อความขนาดเล็ก
- การแก้ไขแบบหลายอินพุตและเวิร์กโฟลว์หลายเทิร์น: รองรับการผสานภาพหลายภาพเป็นอินพุตและการแก้ไขแบบวนซ้ำหลายรอบได้อย่างแข็งแกร่ง
📊 ประสิทธิภาพการทดสอบมาตรฐาน — การสร้างและแก้ไขภาพ (คะแนน Elo)
| ความสามารถ | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| การแปลงข้อความเป็นภาพ — ความชอบโดยรวม | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| การแปลงข้อความเป็นภาพ — คุณภาพเชิงภาพ | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| การแปลงข้อความเป็นภาพ — อินโฟกราฟิก (ความเป็นข้อเท็จจริง) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| การแก้ไข — ทั่วไป | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| การแก้ไข — ตัวละคร | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| การแก้ไข — สร้างสรรค์ | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| การแก้ไข — วัตถุ/สภาพแวดล้อม | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| การแก้ไข — หลายอินพุต | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| การแก้ไข — การทำสไตล์ | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
ข้อสรุปสำคัญจากตารางผลทดสอบนี้:
- ในหมวดการแปลงข้อความเป็นภาพและการแก้ไขภาพ Gemini 3.1 Flash Image ทำคะแนนนำหรือตามติดคะแนนสูงสุดอย่างสม่ำเสมอ เมื่อเทียบกับโมเดลภาพระดับ Flash และคู่แข่งหลายราย
- โมเดลแสดงผลลัพธ์ที่โดดเด่นเป็นพิเศษใน คุณภาพเชิงภาพ และ อินโฟกราฟิก (ความเป็นข้อเท็จจริง) บ่งชี้ว่ามีความสามารถไม่เพียงด้านความสวยงาม แต่ยังรวมถึงการเรนเดอร์เนื้อหาที่ถูกต้องตามโครงสร้างด้วย
- ในการแก้ไขแบบหลายอินพุต Nano Banana 2 ยังแสดงความสามารถในการทำให้ทั่วไปที่แข็งแกร่ง โดยทำคะแนนสูงกว่ารุ่น Flash ก่อนหน้า
การประเมินเหล่านี้ดำเนินการผ่านการเปรียบเทียบแบบจับคู่โดยมนุษย์ตามวิธี Elo บนชุดเบนช์มาร์กที่หลากหลาย สะท้อนทั้งความชอบและความเที่ยงตรงในงานสร้าง/แก้ไขภาพที่ใช้กันทั่วไป
Nano Banana 2 เทียบกับ Nano Banana เทียบกับ Nano Banana Pro
| โมเดล | การวางตำแหน่ง | เบนช์มาร์ก/บันทึกที่เป็นตัวแทน |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | ระดับ Flash: ความเร็ว + คุณภาพเชิงภาพสูง (2K–4K) | ความชอบโดยรวม 1079.0 ± 7.0; คุณภาพเชิงภาพ 1140 ± 6.0 (GenAI-Bench ภายใน). |
| Gemini 2.5 Flash Image (Nano Banana) | รุ่น Flash ก่อนหน้า (ความเที่ยงตรงต่ำกว่า) | คะแนนความชอบ/คุณภาพเชิงภาพต่ำกว่า 3.1 เล็กน้อย. |
| Gemini 3 Pro Image (Nano Banana Pro) | ระดับ Pro: ความเที่ยงตรงที่รับรู้ได้สูงกว่าสำหรับงานซับซ้อน ต้นทุน/ความหน่วงสูงกว่า | มีการแลกเปลี่ยนที่ต่างกัน; ตัวชี้วัดบางรายการแสดงอันดับสัมพัทธ์ที่ต่างไปในงานเฉพาะทาง. |
| GPT-Image 1.5 / โมเดลเชิงพาณิชย์อื่น | คู่แข่ง (โอเพน/ปิด) | ในการทดสอบภายในของ Google GPT-Image และรุ่นอื่นทำคะแนนต่ำกว่า Gemini 3.1 ในด้านคุณภาพเชิงภาพและความชอบโดยรวมตามรายงานการประเมิน ผลการเปรียบเทียบจากบุคคลที่สามอิสระอาจแตกต่างกัน. |
เมื่อใดควรเลือก Flash Image Preview:
- พรีวิวภาพแบบเรียลไทม์ในแอป
- การสร้างภาพขนาดใหญ่ที่คำนึงถึงต้นทุน
- ผู้ช่วยออกแบบแบบอินเทอร์แอกทีฟ
วิธีเข้าถึงและผสานใช้งาน Nano Banana 2
ขั้นตอนที่ 1: ลงทะเบียนเพื่อรับ API Key
เข้าสู่ระบบที่ cometapi.com. หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ คอนโซล CometAPI. รับ API key สำหรับสิทธิ์การเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเคน: sk-xxxxx แล้วส่ง
ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ Nano Banana 2
เลือกเอ็นด์พอยต์ “gemini-3.1-flash-image-preview8” เพื่อส่งคำขอ API และกำหนด request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ จุดที่เรียกใช้: Gemini สร้างภาพ
Nano Banana 2 รองรับการแก้ไขภาพ การสร้างภาพ และเวิร์กโฟลว์หลายภาพ สำหรับการแก้ไขภาพ คุณต้องอัปโหลด URL ของรูปภาพ สำหรับพารามิเตอร์เพิ่มเติม โปรดดูเอกสารประกอบ
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังการประมวลผล API จะตอบกลับด้วยสถานะงานและข้อมูลผลลัพธ์ คุณสามารถดาวน์โหลดภาพไปยังเครื่องของคุณได้โดยตรงใน playground (โดยทั่วไปเป็นรูปแบบ PNG) ในกระบวนการ API จะสร้าง URL ของภาพ โปรดดาวน์โหลดโดยเร็ว