โมเดลสนับสนุนองค์กรบล็อก
500+ AI Model API ทั้งหมดในหนึ่ง API เพียงแค่ใน CometAPI
API โมเดล
นักพัฒนา
เริ่มต้นอย่างรวดเร็วเอกสารประกอบแดชบอร์ด API
ทรัพยากร
โมเดล AIบล็อกองค์กรบันทึกการเปลี่ยนแปลงเกี่ยวกับ
2025 CometAPI สงวนลิขสิทธิ์ทั้งหมดนโยบายความเป็นส่วนตัวข้อกำหนดการให้บริการ
Home/Models/Google/Nano Banana 2
G

Nano Banana 2

อินพุต:$0.4/M
เอาต์พุต:$2.4/M
ภาพรวมความสามารถหลัก: ความละเอียด: สูงสุด 4K (4096×4096) เทียบเท่า Pro. ความสม่ำเสมอของภาพอ้างอิง: รองรับภาพอ้างอิงได้สูงสุด 14 ภาพ (วัตถุ 10 รายการ + ตัวละคร 4 ตัว), รักษาความสม่ำเสมอของสไตล์/ตัวละคร. อัตราส่วนภาพแบบสุดโต่ง: เพิ่มอัตราส่วนใหม่ 1:4, 4:1, 1:8, 8:1 เหมาะสำหรับภาพแนวยาว, โปสเตอร์ และแบนเนอร์. การเรนเดอร์ข้อความ: การสร้างข้อความขั้นสูง เหมาะสำหรับอินโฟกราฟิกและเลย์เอาต์โปสเตอร์สำหรับการตลาด. การปรับปรุงการค้นหา: ผสาน Google Search + การค้นหาด้วยภาพ. การยึดโยง: มีกระบวนการคิดในตัว; ทำการให้เหตุผลกับพรอมป์ตที่ซับซ้อนก่อนการสร้าง.
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API
เวอร์ชัน

ข้อมูลจำเพาะทางเทคนิคของ Gemini 3.1 Flash Image Preview

รายการGemini 3.1 Flash Image Preview
ผู้ให้บริการGoogle
ตระกูลโมเดลGemini 3.1 (Flash tier)
เป้าหมายหลักการสร้างแบบมัลติโหมดความเร็วสูงพร้อมพรีวิวภาพ
ชนิดอินพุตข้อความ, รูปภาพ
ชนิดเอาต์พุตข้อความ, รูปภาพ (การสร้างพรีวิว)
ขนาดหน้าต่างบริบทสูงสุด 1M โทเค็น (มาตรฐานระดับ Flash ของ Gemini 3.x)
ระดับความหน่วงความหน่วงต่ำ ปริมาณงานสูง
รองรับการสตรีมใช่
การเรียกใช้เครื่องมือใช่ (กรอบงานเครื่องมือ Gemini API)
เวอร์ชัน3.1

Nano Banana 2 คืออะไร

Nano Banana 2 เป็นชื่อเล่นยอดนิยมที่สื่อและชุมชนนักพัฒนาใช้เรียกโมเดล Gemini-3.1-Flash-Image ที่เพิ่งเปิดตัว Google วางตำแหน่งให้เป็นเอนจินภาพระดับ “Flash” ซึ่งมอบความคมชัดใกล้ระดับ Pro ในชั้นความหน่วงและต้นทุนที่ต่ำกว่า เหมาะสำหรับการสร้างปริมาณมาก การแก้ไขแบบวนซ้ำอย่างรวดเร็ว และเวิร์กโฟลว์ผลิตภัณฑ์แบบบูรณาการทั่วบริการของ Google โมเดลนี้สืบทอดความสามารถด้านการให้เหตุผลแบบมัลติโหมดจาก Gemini 3.1 และเพิ่มความสามารถที่เน้นภาพ (ข้อความในภาพอ่านได้ชัดเจน การผสานภาพหลายภาพ อัตราส่วนกว้างหลากหลาย รองรับ 4K แบบเนทีฟ)

คุณสมบัติหลัก

  • ความเร็วสูง รองรับหลายความละเอียด: ความเร็วระดับ Flash พร้อมตัวเลือกเอาต์พุต 0.5K / 1K / 2K / 4K และอัตราส่วนภาพแบบสุดขั้วใหม่ (1:4, 4:1, 1:8, 8:1)
  • การยึดโยงกับเว็บแบบเรียลไทม์: ผนวกผลการค้นหาทั้งข้อความและรูปภาพเพื่อยึดโยงเนื้อหาที่สร้างกับข้อมูลบนเว็บปัจจุบันเมื่อเปิดใช้งาน “Thinking” หรือการยึดโยงกับการค้นหา เหมาะสำหรับข้อมูลอ้างอิงที่ทันสมัยและอินโฟกราฟิกเชิงข้อเท็จจริง
  • การเรนเดอร์ข้อความที่ดีขึ้น: เรนเดอร์ข้อความสั้นและข้อความกราฟิก (ฟอนต์ ขนาด) ได้ดีกว่ารุ่น Flash ก่อนหน้า; ยังไม่สมบูรณ์แบบกับย่อหน้ายาว/ตัวอักษรขนาดเล็ก
  • การแก้ไขแบบหลายอินพุตและเวิร์กโฟลว์หลายรอบ: รองรับการรวมภาพหลายภาพเป็นอินพุตและการแก้ไขแบบวนซ้ำข้ามหลายรอบได้อย่างแข็งแกร่ง

📊 ผลการทดสอบเกณฑ์มาตรฐาน — การสร้างและแก้ไขภาพ (คะแนน Elo)

ความสามารถGemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
ข้อความเป็นภาพ — ความชื่นชอบโดยรวม1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
ข้อความเป็นภาพ — คุณภาพภาพ1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
ข้อความเป็นภาพ — อินโฟกราฟิก (ข้อเท็จจริง)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
การแก้ไข — ทั่วไป1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
การแก้ไข — ตัวละคร1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
การแก้ไข — เชิงสร้างสรรค์1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
การแก้ไข — วัตถุ/สภาพแวดล้อม1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
การแก้ไข — หลายอินพุต1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
การแก้ไข — การทำสไตล์1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

ข้อสรุปสำคัญจากตารางเกณฑ์มาตรฐานนี้:

  • ในหมวดการสร้างจากข้อความเป็นภาพและการแก้ไขภาพ Gemini 3.1 Flash Image มีคะแนนนำหรือทัดเทียมคะแนนสูงสุด ในกลุ่มระดับ Flash และเมื่อเทียบกับโมเดลภาพคู่แข่งหลายตัว
  • โมเดลแสดงผลลัพธ์ที่โดดเด่นอย่างยิ่งในเกณฑ์ คุณภาพภาพ และ อินโฟกราฟิก (ความเที่ยงตรงข้อเท็จจริง) — บ่งชี้ว่าโดดเด่นทั้งด้านความสวยงามและการเรนเดอร์โครงสร้างที่ถูกต้อง
  • ในงานแก้ไขแบบหลายอินพุต Nano Banana 2 ยังแสดงการทำให้เป็นสากลที่แข็งแรง โดยมีคะแนนสูงกว่ารุ่น Flash รุ่นก่อน

การประเมินเหล่านี้ดำเนินการผ่านการเปรียบเทียบแบบเคียงข้างกันโดยมนุษย์ตามระบบ Elo บนชุดเกณฑ์มาตรฐานที่หลากหลาย สะท้อนทั้งความชื่นชอบและความเที่ยงตรงในงานสร้าง/แก้ไขภาพที่ใช้กันทั่วไป

Nano Banana 2 เทียบกับ Nano Banana และ Nano Banana Pro

โมเดลการวางตำแหน่งเกณฑ์มาตรฐาน/หมายเหตุที่เป็นตัวแทน
Gemini 3.1 Flash Image (Nano Banana 2)ระดับ Flash: ความเร็ว + คุณภาพภาพสูง (2K–4K)ความชื่นชอบโดยรวม 1079.0 ± 7.0; คุณภาพภาพ 1140 ± 6.0 (GenAI-Bench ภายใน)
Gemini 2.5 Flash Image (Nano Banana)รุ่น Flash ก่อนหน้า (ความเที่ยงตรงต่ำกว่า)คะแนนความชื่นชอบ/คุณภาพภาพต่ำกว่า 3.1 เล็กน้อย
Gemini 3 Pro Image (Nano Banana Pro)ระดับ Pro: ความเที่ยงตรงที่รับรู้สูงขึ้นสำหรับงานซับซ้อน ต้นทุน/ความหน่วงสูงกว่าการแลกเปลี่ยนที่แตกต่าง; เมตริกบางอย่างแสดงอันดับสัมพัทธ์ที่ต่างกันในงานเฉพาะทาง
GPT-Image 1.5 / โมเดลเชิงพาณิชย์อื่นคู่แข่ง (เปิด/ปิดซอร์ส)ในเกณฑ์มาตรฐานภายในของ Google รายงานว่าคะแนนของ GPT-Image และรุ่นอื่นต่ำกว่า Gemini 3.1 ในด้านคุณภาพภาพและความชื่นชอบโดยรวม การเปรียบเทียบโดยบุคคลที่สามอิสระอาจแตกต่างกัน

เมื่อใดควรเลือก Flash Image Preview:

  • พรีวิวภาพแบบเรียลไทม์ในแอป
  • การสร้างภาพขนาดใหญ่ที่ต้องคุมต้นทุน
  • ผู้ช่วยออกแบบแบบอินเทอร์แอกทีฟ

วิธีเข้าถึงและผสาน Nano Banana 2

ขั้นตอนที่ 1: สมัครรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ระบบที่ CometAPI console รับ API key ของการเชื่อมต่ออินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx และส่ง

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ Nano Banana 2

เลือกปลายทาง “gemini-3.1-flash-image-preview8” เพื่อส่งคำขอ API และกำหนด request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ จุดที่เรียกใช้งาน: Gemini สร้างภาพ

Nano Banana 2 รองรับการแก้ไขภาพ การสร้างภาพ และเวิร์กโฟลว์แบบหลายภาพ สำหรับการแก้ไขภาพ คุณต้องอัปโหลด URL ของภาพ สำหรับพารามิเตอร์เพิ่มเติม โปรดดูเอกสารประกอบ

ขั้นตอนที่ 3: ดึงผลลัพธ์และตรวจสอบความถูกต้อง

ประมวลผลการตอบกลับของ API เพื่อรับผลลัพธ์ที่สร้างขึ้น หลังการประมวลผล API จะตอบกลับสถานะงานและข้อมูลเอาต์พุต คุณสามารถดาวน์โหลดภาพลงเครื่องของคุณโดยตรงใน playground (โดยทั่วไปเป็นรูปแบบ PNG) จะมีการสร้าง URL ของภาพในกระบวนการ API; โปรดดาวน์โหลดโดยเร็ว

คำถามที่พบบ่อย

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 คือโมเดล AI สำหรับการสร้างและแก้ไขภาพรุ่นล่าสุดของ Google ซึ่งสร้างขึ้นบนเทคโนโลยีภาพ Gemini Flash เพื่อมอบการสร้างภาพที่รวดเร็ว คุณภาพสูง และการทำตามคำสั่งได้อย่างแม่นยำทั้งจากอินพุตข้อความและภาพ

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 โดยพื้นฐานแล้วคือแบรนด์ที่หันสู่ผู้บริโภคของโมเดล Gemini 3.1 Flash Image ของ Google โดยผสานความสามารถขั้นสูงจาก Nano Banana เวอร์ชันก่อนหน้าเข้ากับความเร็วของโมเดล Flash

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 มาพร้อมความเร็วในการสร้างที่สูงขึ้น รายละเอียดที่คมชัดกว่า ความแม่นยำในการทำตามคำสั่งที่ดีขึ้น การเรนเดอร์ข้อความ/การแปลแบบท้องถิ่นที่ได้รับการปรับปรุง และการควบคุมเชิงสร้างสรรค์ที่กว้างขึ้น พร้อมทั้งทำให้ฟีเจอร์ระดับ Pro จำนวนมากพร้อมใช้งานในระดับพื้นฐาน

What kinds of images and resolutions can Nano Banana 2 generate?

โมเดลรองรับเอาต์พุตที่ยืดหยุ่นด้วยอัตราส่วนภาพและความละเอียดที่หลากหลาย สูงสุดถึง 4K เหมาะสำหรับโซเชียลมีเดีย โฆษณา จอแสดงผล และคอนเทนต์ระดับมืออาชีพ

Can Nano Banana 2 maintain consistency in complex compositions?

ได้ — โมเดลสามารถรักษาความสอดคล้องระหว่างตัวแบบและวัตถุหลายรายการ (เช่น สูงสุดห้าตัวละครและ 14 วัตถุในเวิร์กโฟลว์พรอมต์เดียว) ช่วยให้เหมาะกับฉากเชิงเรื่องเล่าและงานสไตล์สตอรีบอร์ด

What image generation use cases is Gemini 3.1 Flash Image best suited for?

เหมาะอย่างยิ่งสำหรับการสร้างและแก้ไขภาพระดับมืออาชีพ อินโฟกราฟิก ความสอดคล้องระหว่างหลายภาพ การเรนเดอร์ข้อความ และเอาต์พุตหลายภาษาที่ปรับให้เข้ากับท้องถิ่น โดยเฉพาะเมื่อเวิร์กโฟลว์ต้องการการควบคุมที่แม่นยำและการทำซ้ำหลายรอบ

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 ผสานความรู้จากโลกจริงและการเชื่อมต่อกับการค้นหารูปภาพ เพื่อช่วยสร้างตัวแบบ อินโฟกราฟิก และภาพที่อิงตำแหน่งได้อย่างแม่นยำยิ่งขึ้น

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

ได้ — โมเดลสามารถสร้างและเรนเดอร์ข้อความที่ชัดเจนภายในภาพได้ แต่ข้อความที่มีขนาดเล็กมากหรือมีหลายย่อหน้าหนาแน่นมาก ๆ บางครั้งยังคงเป็นความท้าทาย

คุณสมบัติสำหรับ Nano Banana 2

สำรวจคุณสมบัติหลักของ Nano Banana 2 ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Nano Banana 2

สำรวจราคาที่แข่งขันได้สำหรับ Nano Banana 2 ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Nano Banana 2 สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้

nano-banana-2(image)

variant / aliasPrice
gemini-3.1-flash-image (0.5K)≈ $0.03600
gemini-3.1-flash-image (1K)≈ $0.05360
gemini-3.1-flash-image (2K)≈ $0.08080
gemini-3.1-flash-image (4K)≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)≈ $0.03600
gemini-3.1-flash-image-preview (1K)≈ $0.05360
gemini-3.1-flash-image-preview (2K)≈ $0.08080
gemini-3.1-flash-image-preview (4K)≈ $0.12080

โค้ดตัวอย่างและ API สำหรับ Nano Banana 2

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ Nano Banana 2 เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Nano Banana 2 ในโครงการของคุณ
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

รุ่นของ Nano Banana 2

เหตุผลที่ Nano Banana 2 มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ
รหัสโมเดลคำอธิบายความพร้อมใช้งานคำขอ
gemini-3.1-flash-imageแนะนำ โดยชี้ไปยังโมเดลล่าสุด✅Gemini สร้างรูปภาพ
gemini-3.1-flash-image-previewพรีวิวอย่างเป็นทางการ✅Gemini สร้างรูปภาพ

โมเดลเพิ่มเติม

D

Doubao Seedream 5

ต่อคำขอ:$0.028
Seedream 5.0 Lite เป็นโมเดลสร้างภาพแบบมัลติโหมดที่ผสานรวมเป็นหนึ่งเดียว มีความสามารถในการคิดเชิงลึกและการค้นหาออนไลน์ โดยมาพร้อมการอัปเกรดแบบครอบคลุมทุกด้านในด้านการทำความเข้าใจ การให้เหตุผล และความสามารถในการสร้าง
F

FLUX 2 MAX

ต่อคำขอ:$0.008
FLUX.2 [max] เป็นโมเดลปัญญาด้านภาพระดับท็อปจาก Black Forest Labs (BFL) ที่ออกแบบมาสำหรับเวิร์กโฟลว์ระดับโปรดักชัน: การตลาด การถ่ายภาพผลิตภัณฑ์ อีคอมเมิร์ซ สายงานสร้างสรรค์ และทุกแอปพลิเคชันที่ต้องการเอกลักษณ์ของตัวละคร/ผลิตภัณฑ์ที่สม่ำเสมอ การเรนเดอร์ข้อความอย่างแม่นยำ และรายละเอียดสมจริงราวภาพถ่ายในความละเอียดระดับหลายเมกะพิกเซล สถาปัตยกรรมถูกวิศวกรรมมาเพื่อการทำตามพรอมต์ที่แข็งแกร่ง การผสานข้อมูลอ้างอิงหลายแหล่ง (สูงสุดสิบภาพอินพุต) และการสร้างที่ยึดโยงกับบริบท (ความสามารถในการผนวกบริบทบนเว็บที่เป็นปัจจุบันเมื่อสร้างภาพ)。
X

Black Forest Labs/FLUX 2 MAX

ต่อคำขอ:$0.056
FLUX.2 [max] เป็นรุ่นเรือธงที่มีคุณภาพสูงสุดของตระกูล FLUX.2 จาก Black Forest Labs (BFL). ถูกวางตำแหน่งให้เป็นโมเดลการสร้างภาพแบบ text→image และการแก้ไขภาพระดับมืออาชีพ ที่มุ่งเน้นความเที่ยงตรงสูงสุด, การยึดตามพรอมป์, และความสม่ำเสมอของการแก้ไขระหว่างตัวละคร วัตถุ แสง และสี. BFL และรีจิสทรีของพาร์ทเนอร์ระบุว่า FLUX.2 [max] เป็นรุ่น FLUX.2 ระดับสูงสุด พร้อมฟีเจอร์สำหรับการแก้ไขโดยใช้อ้างอิงหลายรายการและการสร้างแบบยึดโยงกับข้อมูล.
O

GPT Image 1.5

อินพุต:$6.4/M
เอาต์พุต:$25.6/M
GPT-Image-1.5 เป็นโมเดลภาพของ OpenAI ใน GPT Image family . เป็นโมเดล GPT แบบมัลติโหมดโดยเนื้อแท้ ออกแบบมาเพื่อสร้างภาพจากพรอมต์ข้อความ และแก้ไขภาพที่ป้อนเข้าด้วยความเที่ยงตรงสูง ขณะเดียวกันก็ปฏิบัติตามคำสั่งของผู้ใช้อย่างเคร่งครัด.
D

Doubao Seedream 4.5

ต่อคำขอ:$0.032
Seedream 4.5 เป็นโมเดลภาพแบบมัลติโมดัลของ ByteDance/Seed (ข้อความ→ภาพ + การแก้ไขภาพ) ที่มุ่งเน้นความซื่อตรงของภาพระดับโปรดักชัน ความสอดคล้องกับพรอมป์ที่ดีขึ้น และความสม่ำเสมอในการแก้ไขที่พัฒนาขึ้นอย่างมาก (การคงเอกลักษณ์ของตัวแบบ การเรนเดอร์ข้อความ/ไทโปกราฟี และความสมจริงของใบหน้า)
R

Black Forest Labs/FLUX 2 PRO

R

Black Forest Labs/FLUX 2 PRO

ต่อคำขอ:$0.06
FLUX 2 PRO เป็นโมเดลเชิงพาณิชย์ระดับเรือธงในตระกูล FLUX 2 ที่มอบความสามารถในการสร้างภาพล้ำสมัยด้วยคุณภาพและรายละเอียดที่ไม่เคยมีมาก่อน พัฒนาสำหรับการใช้งานระดับมืออาชีพและองค์กร โดยโดดเด่นด้วยความสอดคล้องกับพรอมต์ที่เหนือกว่า ผลลัพธ์สมจริงเสมือนภาพถ่าย และความสามารถเชิงศิลป์อันยอดเยี่ยม โมเดลนี้เป็นตัวแทนของเทคโนโลยีสังเคราะห์ภาพด้วย AI ระดับแนวหน้า

บล็อกที่เกี่ยวข้อง

OpenClaw มีราคาเท่าไหร่ในปี 2026? รายละเอียดราคาแบบครบถ้วน
Apr 13, 2026
openclaw

OpenClaw มีราคาเท่าไหร่ในปี 2026? รายละเอียดราคาแบบครบถ้วน

ซอฟต์แวร์หลักของ OpenClaw ฟรี 100% (MIT license). ค่าใช้จ่ายรายเดือนในสถานการณ์ใช้งานจริงอยู่ระหว่าง $0–$13 สำหรับการใช้งานส่วนตัวแบบเบาๆ** (โฮสติ้งแบบฟรี + โมเดลราคาถูก) ถึง **$25–$100 สำหรับทีมขนาดเล็ก และ $100–$200+ สำหรับการทำอัตโนมัติแบบเข้มข้น. แผนที่มีการจัดการอย่างเป็นทางการของ OpenClaw Cloud เป็นราคาแบบคงที่ $59/เดือน ($29.50 สำหรับเดือนแรก). โทเคน API เป็นตัวแปรที่ใหญ่ที่สุด—การเพิ่มประสิทธิภาพอย่างชาญฉลาดสามารถลดได้ถึง 90%.
GPT Image 1.5 เทียบกับ Seedream 4.5: ตัวไหนดีกว่าในปี 2026
Apr 12, 2026
gpt-image-1-5
seedream-4-5

GPT Image 1.5 เทียบกับ Seedream 4.5: ตัวไหนดีกว่าในปี 2026

GPT Image 1.5 (OpenAI, Dec 2025) โดดเด่นด้วยการสร้างผลลัพธ์เร็วขึ้น 4× (5–15 วินาที), คะแนน LM Arena ELO ระดับแนวหน้า (~1,264–1,285), และความสามารถในการปฏิบัติตามคำสั่งเพื่อการแก้ไขที่เหนือกว่า। Seedream 4.5 (ByteDance, Dec 2025) โดดเด่นด้านไทโปกราฟี, ความละเอียด 4K, ความสอดคล้องระหว่างหลายภาพ (ได้สูงสุด 14 รายการอ้างอิง), และราคาแบบคงที่ $0.04/ภาพ。 เลือก GPT Image 1.5 เพื่อความเร็วและความยืดหยุ่น; เลือก Seedream 4.5 สำหรับงานเชิงพาณิชย์ที่เน้นการออกแบบหนัก。 ทั้งสองเข้าถึงได้ในราคาประหยัดผ่านแพลตฟอร์มแบบรวมของ **CometAPI** เพื่อการประหยัด 20%+ และการผสานรวมแบบคีย์เดียว。
ChatGPT ใช้เวลานานเท่าใดในการสร้างภาพในปี 2026?
Apr 9, 2026
chat-gpt

ChatGPT ใช้เวลานานเท่าใดในการสร้างภาพในปี 2026?

ในปี 2026 ChatGPT โดยทั่วไปสร้างภาพได้ภายใน **5–20 วินาที** โดยใช้โมเดล GPT-Image 1.5 รุ่นล่าสุด (ซึ่งเป็นรุ่นสืบทอดต่อจาก DALL·E 3) พรอมต์ที่เรียบง่ายอาจเสร็จในเพียง 3–8 วินาที ขณะที่คำขอที่ซับซ้อนหรือมีรายละเอียดสูงอาจใช้เวลา 20–60 วินาทีในช่วงเวลาที่มีการใช้งานหนาแน่น ผู้ใช้แบบฟรีมักต้องรอนานกว่า (30–60+ วินาที) ในขณะที่สมาชิก Plus/Pro จะได้รับประโยชน์จากการประมวลผลแบบมีลำดับความสำคัญ ระยะเวลาเหล่านี้ถือเป็นการปรับปรุงครั้งใหญ่เมื่อเทียบกับค่าเฉลี่ย 15–30 วินาทีของ DALL·E 3 ในช่วงปี 2024–2025 อันเป็นผลจากการอัปเกรด GPT-Image 1.5 ของ OpenAI ในเดือนธันวาคม 2025 ที่มอบการอนุมานที่เร็วขึ้นสูงสุด 4×
Alibaba Wan2.7-Image รีวิว 2026: โมเดลภาพ AI แบบรวมเป็นหนึ่งเดียวที่ปฏิวัติวงการ
Apr 3, 2026

Alibaba Wan2.7-Image รีวิว 2026: โมเดลภาพ AI แบบรวมเป็นหนึ่งเดียวที่ปฏิวัติวงการ

Wan2.7-Image เป็นโมเดลภาพแบบรวมที่ Alibaba Cloud เพิ่งเปิดตัว โดยประกาศเมื่อวันที่ 1 เมษายน 2026 โมเดลนี้ผสานการสร้างภาพ การแก้ไขภาพ และความเข้าใจเชิงภาพไว้ในเวิร์กโฟลว์เดียว รองรับอินพุตหลายภาพ และได้รับการออกแบบให้สร้างผลลัพธ์ได้เร็วกว่ารุ่น Pro Alibaba ระบุว่าโมเดลสามารถทำงานกับการแปลงข้อความเป็นภาพ การแก้ไขภาพ การสร้างชุดภาพ และการใช้ภาพอ้างอิงหลายภาพ ขณะที่ Wan2.7-Image-Pro เพิ่มการส่งออกความละเอียด 4K และองค์ประกอบภาพที่เสถียรมากขึ้น
Luma AI Unit-1 โมเดลภาพ (2026): การวิเคราะห์และการเปรียบเทียบอย่างครอบคลุม
Mar 24, 2026

Luma AI Unit-1 โมเดลภาพ (2026): การวิเคราะห์และการเปรียบเทียบอย่างครอบคลุม

Uni-1 ของ Luma AI คือโมเดลภาพหลายรูปแบบแบบอัตถดถอยรุ่นถัดไป ที่ผสานการสร้างภาพและความเข้าใจเชิงภาพไว้ในสถาปัตยกรรมเดียว ต่างจากโมเดลแบบ diffusion ตรงที่มันประมวลผลโทเค็นข้อความและภาพในลำดับร่วมกัน ทำให้มีความสามารถด้านการให้เหตุผล การแก้ไข และเวิร์กโฟลว์สร้างสรรค์แบบหลายรอบได้ดีกว่า Uni-1 มีประสิทธิภาพเหนือกว่าคู่แข่งอย่าง GPT Image 1.5 และ Nano Banana 2 บนเบนช์มาร์กที่อิงตรรกะ เช่น RISEBench