ในฐานะผู้สร้าง AI ฉันรู้สึกตื่นเต้นที่จะแนะนำคุณให้รู้จัก กล้วยนาโน — ชื่อเล่นเล่นๆ ของ ภาพแฟลช Gemini 2.5 — โมเดลการสร้างและแก้ไขรูปภาพที่มีความเที่ยงตรงสูงใหม่ล่าสุดของ Google ในการเจาะลึกนี้ ผมจะอธิบายว่ามันคืออะไร วิธีใช้งาน (แอปและ API) วิธีเรียกใช้งานอย่างมีประสิทธิภาพ ยกตัวอย่างที่เป็นรูปธรรม แทรกโค้ดที่พร้อมใช้งาน และอธิบายขั้นตอนต่างๆ เจ็ดวิธีการใช้งานที่สร้างสรรค์และใช้งานได้จริง คุณสามารถเริ่มสมัครได้ตั้งแต่วันนี้
Gemini 2.5 Flash Image (Nano Banana) คืออะไร?
Gemini 2.5 Flash Image คือโมเดลการสร้างและแก้ไขรูปภาพใหม่ในตระกูล Gemini พัฒนาต่อยอดจากตระกูล Gemini 2.5 Flash เพื่อสร้างและแก้ไขรูปภาพ (ไม่ใช่แค่ข้อความ) โดยผสานรวมการใช้เหตุผลแบบหลายโหมด ความรู้เกี่ยวกับโลก และการควบคุมที่ขับเคลื่อนด้วยคำสั่งของ Gemini เพื่อสร้างหรือแก้ไขรูปภาพจากอินพุตข้อความและ/หรือรูปภาพ ทีมและเอกสารของนักพัฒนาได้เรียกมันอย่างชัดเจนว่า "Gemini 2.5 Flash Image" และระบุชื่อเล่นภายใน กล้วยนาโน.
เมื่อมีการประกาศราคาที่เผยแพร่สำหรับระดับ Gemini 2.5 Flash Image คือ $30 ต่อโทเค็นเอาต์พุต 1 ล้านโดยมีตัวอย่างต้นทุนต่อภาพรายงานเป็น โทเค็นเอาท์พุต 1290 อัน ≈ $0.039 ต่อภาพโมเดลนี้มีให้เลือกใช้งานในเวอร์ชันตัวอย่าง (ID ของผู้พัฒนา/เวอร์ชันตัวอย่าง เช่น gemini-2.5-flash-image-preview) และพร้อมให้บริการแล้วผ่านพันธมิตรที่ได้รับการคัดเลือก (CometAPI) และแพลตฟอร์มนักพัฒนาของ Google เอง
Gemini 2.5 Flash Image มีคุณสมบัติโดดเด่นอะไรบ้าง?
ความสอดคล้องของตัวละครและสไตล์ตลอดการตัดต่อ
การปรับปรุงที่สำคัญประการหนึ่งคือ ความสม่ำเสมอของตัวละคร: แบบจำลองนี้ได้รับการปรับแต่งอย่างชัดเจนเพื่อให้วัตถุ (บุคคล สัตว์เลี้ยง หรือผลิตภัณฑ์) มีความสอดคล้องกันทางสายตาแม้จะผ่านการตัดต่อหลายครั้งและบริบทที่แตกต่างกัน ซึ่งเป็นจุดอ่อนที่มีมายาวนานของแบบจำลองภาพรุ่นก่อนๆ วิธีนี้ช่วยปรับปรุงเวิร์กโฟลว์ที่ต้องใช้ทรัพยากรแบรนด์ที่สอดคล้องกัน ตัวละครที่ซ้ำๆ ในการเล่าเรื่อง หรือภาพถ่ายผลิตภัณฑ์หลายช็อตที่สร้างขึ้นโดยอัตโนมัติ
การแก้ไขตามท้องถิ่นตามคำแนะนำ
คุณสามารถใส่รูปภาพพร้อมคำสั่งภาษาธรรมชาติ เช่น "ลบรอยเปื้อนบนเสื้อ" "เปลี่ยนชุดเป็นแจ็คเก็ตสีน้ำเงิน" หรือ "เบลอพื้นหลังและเพิ่มความสว่างให้กับตัวแบบ" จากนั้นโมเดลจะทำการแก้ไขเฉพาะจุดโดยไม่จำเป็นต้องใช้มาสก์ด้วยตนเองในหลายกรณี ซึ่งทำให้เหมาะสำหรับการแก้ไขแบบวนซ้ำและแบบสนทนา
การรวมภาพหลายภาพและการถ่ายโอนสไตล์
Gemini 2.5 Flash Image สามารถถ่ายภาพได้หลายภาพและ แต่ง นำมารวมกันเป็นฉากเดียว หรือถ่ายโอนสไตล์/พื้นผิวจากภาพหนึ่งไปยังอีกภาพหนึ่ง ซึ่งช่วยให้สามารถสร้างโมเดลจำลองผลิตภัณฑ์ (วางผลิตภัณฑ์ลงในฉาก) จัดวางเฟอร์นิเจอร์ หรือสร้างภาพรวมสำหรับการตลาดและอีคอมเมิร์ซได้
ความรู้เกี่ยวกับโลกพื้นเมือง
เนื่องจากสร้างขึ้นจากตระกูล Gemini โมเดลจึงใช้ประโยชน์จากความรู้เกี่ยวกับโลก เช่น การทำความเข้าใจอุปกรณ์ประกอบฉาก สภาพแวดล้อม หรือความสัมพันธ์ของวัตถุที่ถูกต้องตามบริบท ซึ่งช่วยในการสร้างฉากที่สมจริงและการแก้ไขที่มีความสอดคล้องทางความหมาย (ไม่ใช่แค่ผลลัพธ์ที่ดูน่าเชื่อถือในเชิงสุนทรียศาสตร์เท่านั้น)
ความหน่วงต่ำและประสิทธิภาพด้านต้นทุน
ตระกูล "Flash" ของ Gemini มุ่งเน้นการใช้งานที่ความหน่วงต่ำและคุ้มค่าเมื่อเทียบกับระดับการใช้งานที่สูงกว่า ประกาศของนักพัฒนาเน้นย้ำถึงความเร็วและการแลกเปลี่ยนราคา/คุณภาพที่คุ้มค่าสำหรับการใช้งานจริงหลายกรณี
แหล่งที่มาในตัว: ลายน้ำ SynthID
รูปภาพทั้งหมดที่สร้าง/แก้ไขด้วยโมเดลรวมถึง ลายน้ำดิจิทัล SynthID ที่มองไม่เห็น เพื่อให้สามารถตรวจสอบภาพในภายหลังได้ว่าสร้างโดย AI หรือแก้ไขโดย AI นี่เป็นส่วนหนึ่งของมาตรการบรรเทาปัญหาการใช้งานในทางที่ผิดและการติดตามแหล่งที่มาในระดับผลิตภัณฑ์ของ Google
1) ฉันจะสร้างตัวละครที่มีความสม่ำเสมอสำหรับการ์ตูนหรือแคมเปญแบรนด์ที่ดำเนินมายาวนานได้อย่างไร
ทำไมถึงได้ผล
Nano Banana ได้รับการฝึกฝนมาเป็นพิเศษให้คงรูปลักษณ์ของตัวละครเดิมไว้ตลอดการตัดต่อและบริบทใหม่ ซึ่งมีประโยชน์เมื่อคุณต้องการให้ใบหน้า ชุด หรือมาสคอตเดิมปรากฏบนทุกตอน ภาพขนาดย่อ หรือภาพฮีโร่ นักพัฒนาเรียกสิ่งนี้ว่า "ความสอดคล้องของตัวละคร"
วิธีการแจ้ง
- เริ่มต้นด้วยบล็อกคำอธิบายที่แสดงถึงคุณลักษณะของตัวตน (ช่วงอายุ ลักษณะใบหน้า เครื่องหมายที่โดดเด่น องค์ประกอบของเครื่องแต่งกาย)
- เพิ่มคำสั่ง "โทเค็นความสอดคล้อง" เช่น "ใช้ตัวอักษรเดียวกันในเอาต์พุตทั้งหมด — อย่าเปลี่ยนเครื่องหมายระบุ"
- สำหรับเอาต์พุตภาพหลายภาพ ให้ใส่ภาพอ้างอิงหนึ่งภาพหรือมากกว่าเป็นอินพุตเพื่อล็อกความคล้ายคลึง
วิธีการกระตุ้นให้มีการแก้ไขอย่างสม่ำเสมอ
- เริ่มต้นด้วยการอธิบายคุณลักษณะสำคัญของตัวตนที่คุณต้องการรักษาไว้ ได้แก่ อายุ สีผม ลักษณะเด่น (เช่น "มีไฝเล็กๆ ที่แก้มซ้าย") และรูปแบบการแต่งกาย
- ใช้คำเตือนสองส่วนเมื่อแก้ไข: ขั้นแรกให้อธิบายว่าอะไร ต้อง คงเดิมแล้วจึงอธิบาย เปลี่ยนแปลง คุณต้องการ ตัวอย่าง: “รักษาไว้: ผู้หญิงเอเชียตะวันออกอายุ 28 ปี ผมบ๊อบสั้นสีดำ ไฝเล็กๆ ที่แก้มซ้าย เปลี่ยน: ให้เธออยู่ในร้านอาหารยุค 1970 สวมแจ็กเก็ตหนังสีแดง ยิ้มแย้ม แสงไฟทังสเตนอบอุ่น”
- เมื่อทำการแก้ไขหลายขั้นตอน ให้รวมโทเค็นอ้างอิงขนาดเล็ก เช่น “(KEEP_ID: A)” ในพรอมต์ และนำกลับมาใช้ใหม่เพื่อส่งสัญญาณเรื่องเดียวกันในพรอมต์ต่างๆ
ตัวอย่างพรอมต์
“สร้างภาพบุคคลที่เหมือนจริงของ มินานักเขียนนิยายภาพวัย 28 ปี ผู้มีทรงผมสั้นไม่สมมาตร มีไฝเสี้ยวที่แก้มซ้าย ดวงตาสีน้ำตาลอบอุ่น และสวมแจ็กเก็ตหนังสีเขียว จดจำลักษณะเด่นของอามินาในฉาก 6 ฉากต่อไปนี้: 'อามินาที่ร้านกาแฟตอนเช้า', 'อามินากำลังร่างภาพในสวนสาธารณะ', ... ใช้ลักษณะที่เหมือนตัวละครเดียวกันในทุกฉาก
ตัวอย่างโค้ด (Python, สร้างรูปภาพหลายภาพ)
ตัวอย่างนี้ใช้ไคลเอนต์ API ของ Gemini ตามที่แสดงในเอกสารของ Google — ส่งคำอธิบายและรูปแบบฉากวนซ้ำของคุณ
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client()
base_description = (
"Photorealistic portrait of Amina: 28yo graphic novelist, short asymmetrical haircut, "
"crescent mole on left cheek, warm brown eyes, green leather jacket. Keep likeness identical across scenes."
)
scenes = [
"Amina at a morning coffee shop, reading a sketchbook, warm golden hour light.",
"Amina sketching in the park, windy afternoon, soft bokeh background.",
# add more scenes...
]
for i, scene in enumerate(scenes, start=1):
prompt = f"{base_description} Scene: {scene}"
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
parts = response.candidates.content.parts
for part in parts:
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"amina_scene_{i}.png")
2) Nano Banana ช่วยเร่งการถ่ายภาพผลิตภัณฑ์อีคอมเมิร์ซและภาพ A/B ได้อย่างไร
ทำไมสิ่งนี้จึงสร้างสรรค์และมีประโยชน์
ทีมผลิตภัณฑ์ใช้ทรัพยากรจำนวนมากในการถ่ายภาพหลายช็อต การจัดแสง และรูปแบบต่างๆ (สี พื้นหลัง) ของ Nano Banana การรวมภาพหลายภาพ และการแก้ไขที่รวดเร็วและแม่นยำช่วยให้คุณสร้างผลิตภัณฑ์ที่หลากหลายและองค์ประกอบไลฟ์สไตล์ที่สอดคล้องกันได้อย่างรวดเร็ว ไม่ว่าจะเป็นภาพแค็ตตาล็อก ฉากไลฟ์สไตล์ และทรัพยากรทางสังคม ซึ่งช่วยลดเวลาในการทำซ้ำและต้นทุนการผลิต
วิธีการแจ้งเตือนสำหรับตัวแปรผลิตภัณฑ์
- ระบุข้อมูลจำเพาะของผลิตภัณฑ์โดยย่อ (ขนาด วัสดุ จานสี) และสไตล์การถ่ายภาพ (เช่น "พื้นหลังสีขาวในสตูดิโอ มุม 45° เงาอ่อน")
- สำหรับรุ่นต่างๆ: ““สร้างหูฟังบลูทูธ 4 รุ่น: สีดำ สีชมพู สีเทาพร้อมที่ครอบหูสีส้ม และสีเทาพร้อมประกายน้ำเงิน โดยทั้งหมดมีแสงเหมือนกัน มุมกล้องเหมือนกัน และอยู่ในห้องสีขาว””
- ใช้การผสมผสานภาพหลายภาพเพื่อวางผลิตภัณฑ์ลงในฉากต่างๆ: "วางเป้สะพายหลังนี้บนผ้าปิกนิกในช่วงเวลาทองที่มีระยะชัดตื้น"
ตัวอย่างคำเตือน (สินค้า)
ภาพ A (อ้างอิงผลิตภัณฑ์): กระเป๋าเป้หนังพรีเมียม สร้างสรรค์ผลงานจากแคตตาล็อกสามแบบ พื้นหลังสีขาว — สีเขียวป่า สีแทน และสีถ่าน — ถ่ายที่มุม 45 องศา แสงเงาอ่อนๆ เป็นธรรมชาติ และความไวแสง ISO 100
ตัวอย่างโค้ด: สร้าง Python อย่างรวดเร็ว (รูปแบบแคตตาล็อก)
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client(api_key="YOUR_API_KEY")
product_image = open("backpack_ref.png","rb").read()
prompt = ("Make 4 variations of this Bluetooth headset: black, pink, gray with orange ear caps, and gray with blue glint – all with the same lighting, same camera angle, and in a white room.")
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
# Save images from response parts (example)
for i, part in enumerate(response.candidates.content.parts):
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"backpack_variant_{i}.png")
ตัวอย่างนี้สะท้อนรูปแบบการใช้งานที่ได้รับการบันทึกไว้ของ Google และเป็นจุดเริ่มต้นที่ดีสำหรับการสร้างตัวแปรผลิตภัณฑ์โดยอัตโนมัติ
ภาพเอาท์พุต:

3) ฉันจะสร้างภาพประกอบการศึกษาที่ผสมผสานภาพถ่ายและแผนภาพได้อย่างไร
ทำไมถึงได้ผล
นาโน บานาน่า ผสานรวม ความรู้โลก (การใช้เหตุผลหลายรูปแบบของ Gemini) เพื่อให้สามารถตีความแผนภาพที่วาดด้วยมือ ใส่คำอธิบายประกอบภาพ หรือสร้างภาพอธิบายจากการผสมผสานระหว่างภาพถ่ายและคำแนะนำแบบข้อความ ซึ่งมีประโยชน์สำหรับการเรียนรู้ทางอิเล็กทรอนิกส์ เอกสารทางเทคนิค และผู้สอนแบบโต้ตอบ
วิธีการแจ้ง
- จัดเตรียมรูปภาพ (เช่น ภาพถ่ายของการทดลองทางกายภาพ) และคำกระตุ้น เช่น "ใส่คำอธิบายภาพนี้ด้วยป้ายกำกับและลูกศรที่อธิบายส่วนประกอบสำคัญ และสร้างรูปภาพที่สองที่แสดงระบบในส่วนตัดขวาง"
ตัวอย่างพรอมต์
สร้างคำอธิบายภาพความรู้สี่ส่วน: เครือข่ายประสาทของสมองมนุษย์, การซ่อมแซมเซลล์, การผลิต ATP, รหัสพันธุกรรมของเกลียวคู่ของดีเอ็นเอ, คลอโรพลาสต์, ภาพถ่ายของพืช
ภาพเอาท์พุต:

4) ฉันจะเปลี่ยนรูปถ่ายจริงให้เป็นรูปแบบการตลาดตามแบรนด์ (เครื่องแต่งกาย แสง พื้นหลัง) ได้อย่างไร
ทำไมถึงได้ผล
แบบจำลองนี้รองรับ การเปลี่ยนแปลงที่กำหนดเป้าหมาย และการปรับแต่งเฉพาะพื้นที่ที่แสดงออกผ่านภาษาธรรมชาติ เช่น เปลี่ยนชุด ปรับแสง เปลี่ยนพื้นหลัง หรือลบวัตถุออก ซึ่งพยายามรักษาเอกลักษณ์ของตัวละครและความสมจริงโดยรวมไว้ ซึ่งช่วยให้สามารถปรับเปลี่ยนรูปแบบการตลาดได้อย่างรวดเร็ว (ชุดตามฤดูกาล ฉากเฉพาะพื้นที่)
วิธีการแจ้ง
- กรุณาใส่ภาพต้นฉบับเป็นข้อมูลอินพุต
- ขอ การแก้ไขแบบกำหนดเป้าหมาย พร้อมคำแนะนำที่ชัดเจน เช่น "เปลี่ยนเสื้อแจ็คเก็ตเป็นเสื้อโค้ทผ้าขนสัตว์สีแดง เปลี่ยนพื้นหลังเป็นถนนในเมืองตอนพลบค่ำ เพิ่มแสงขอบโทนอบอุ่น"
ตัวอย่างพรอมต์
“เริ่มจากรูปที่อัพโหลด ให้เปลี่ยนแจ็คเก็ตยีนส์สีน้ำเงินเป็นเสื้อโค้ทขนสัตว์สีแดงที่ตัดเย็บเข้ารูป ตั้งพื้นหลังเป็นถนนในเมืองยามเย็นพร้อมแสงโบเก้อ่อนๆ และเพิ่มแสงขอบที่นุ่มนวลเพื่อแยกวัตถุออกจากพื้นหลัง”
คำแนะนำ
- หากคุณต้องการการควบคุมแบบวนซ้ำ ให้ทำการแก้ไขหลายรอบ: ขอแก้ไขครั้งแรก จากนั้นปรับแต่ง ("ถอดหมวกออก" "ตอนนี้เพิ่มอุณหภูมิสี")
5) ทีมงานผู้สร้างแอนิเมชั่นและทีมสร้างภาพจำลองล่วงหน้าสามารถสร้างต้นแบบฉากและสตอรี่บอร์ดได้อย่างไร
เพราะเหตุใดจึงมีประโยชน์
ผู้กำกับและ DP สามารถสร้างต้นแบบการจัดแสง ตู้เสื้อผ้า และการจัดองค์ประกอบกล้องได้อย่างรวดเร็ว Nano Banana สามารถผลิตสตอรี่บอร์ดที่มีตัวละครที่สอดคล้องกัน ซึ่งช่วยในการวางแผนและเตรียมภาพล่วงหน้า ()
H3: ตัวอย่างคำเตือน
There is a tree house in the forest at night with colorful lights hanging on the trees
ภาพเอาท์พุต:

6) Nano Banana สามารถนำมาใช้เป็นงานศิลปะแนวคิด ทรัพยากรในเกม และตัวละครที่สอดคล้องกันในเกมได้อย่างไร
ทำไมสตูดิโอเกมและนักพัฒนาอิสระจึงควรใส่ใจ
การสร้างทรัพยากรทางศิลปะและการทำซ้ำรูปลักษณ์ของตัวละครมักต้องอาศัยศิลปินในการดัดแปลงตัวละครซ้ำแล้วซ้ำเล่า ความสม่ำเสมอของตัวละครใน Nano Banana ทำให้สามารถสร้างท่าทาง เครื่องแต่งกาย และการจัดแสงที่หลากหลายให้สอดคล้องกับเอกลักษณ์ของตัวละครตัวเดียวได้จริง ซึ่งช่วยประหยัดเวลาได้อย่างมากในขั้นตอนก่อนการผลิตและการสร้างต้นแบบอย่างรวดเร็ว
วิธีการแจ้งเตือนสำหรับทรัพย์สินเกม
- กำหนดแผ่นข้อมูลตัวละคร "ตามแบบแผน" ในข้อความ: ส่วนสูง ประเภทร่างกาย คุณสมบัติหลัก เสื้อผ้าหลัก
- ขอเอาต์พุตหลายรายการ: "สร้างชุดเกราะต่อสู้สามแบบที่มีลักษณะใบหน้าเหมือนกัน โดยแสดงด้านหน้า ด้านข้าง และท่าทาง ¾"
- สำหรับงานศิลปะเกี่ยวกับสภาพแวดล้อม ให้ใช้การผสมผสานภาพหลายภาพ: ให้ภาพตัวละครหนึ่งภาพและสภาพแวดล้อมหนึ่งภาพ และแจ้งให้ผสมผสานทั้งสองภาพเข้าด้วยกัน
ตัวอย่างคำเตือน (ทรัพยากรเกม)
สร้างชุดเกราะสามแบบสำหรับ 'Kael, the wind ranger': คงลักษณะใบหน้าไว้ (กรามแคบ แผลเป็นเหนือคิ้วขวา) ชุดเกราะ A: หนัง + ผ้าสีเขียวอมฟ้า; ชุดเกราะ B: เกล็ด + ทองเหลือง; ชุดเกราะ C: สีดำด้านล่องหน แสดงผลแบบเต็มตัวด้านหน้า โปรไฟล์ ¾

เกราะ C: Stealth Matte Black

เกราะ B: เกล็ด + ทองเหลือง

เกราะ A: หนัง + ผ้าสีเขียวอมฟ้า
7) ฉันจะทำให้เวิร์กโฟลว์การปรับแต่งภาพเป็นแบบอัตโนมัติด้วยการแก้ไขแบบสนทนาหลายรอบได้อย่างไร
ทำไมถึงได้ผล
Nano Banana รองรับการแก้ไขภาพแบบสนทนาหลายรอบ: คุณสามารถขอให้แก้ไข ตรวจสอบผลลัพธ์ และติดตามผลด้วยคำแนะนำเพิ่มเติมในภาษาธรรมชาติ เหมาะอย่างยิ่งสำหรับการสร้างขั้นตอนการรีทัชแบบมนุษย์ที่คอยดูแล โดยที่ผู้แก้ไขจะคอยผลักดันโมเดลผ่านหลายๆ รอบ
วิธีการนำเวิร์กโฟลว์ไปใช้
- อัพโหลดรูปถ่ายเบื้องต้นและขอการปรับแต่งพื้นฐาน (แสง การลบรอยตำหนิ)
- ในแต่ละรอบ ให้ส่งรูปภาพที่แก้ไขใหม่กลับไปยังโมเดลพร้อมคำสั่งถัดไป ("ลดไฮไลท์ เพิ่มเงา ครอบตัดเป็น 4:5")
- บันทึกแต่ละขั้นตอนเพื่อให้คุณสามารถย้อนกลับหรือใช้รหัสผ่านเดียวกันกับชุดได้
สไนปเป็ตเวิร์กโฟลว์ขนาดเล็ก (Python)
# 1) Initial retouch
prompt1 = "Remove small blemishes, even skin tone, slightly warm color grade"
response1 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response1 -> edited_v1.png
# 2) Follow-up tweak
prompt2 = "Crop to 4:5, increase local contrast on eyes, desaturate background slightly"
response2 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response2 -> edited_v2.png
ฉันจะแจ้งเตือน Nano Banana ให้ได้ผลลัพธ์ที่ดีที่สุดได้อย่างไร
ฉันควรปฏิบัติตามหลักการกระตุ้นเตือนอะไรบ้าง?
กล้วยนาโนตอบสนองได้ดีที่สุด คำบรรยายแบบบรรยาย ที่อธิบายฉาก มุมมอง แสง และอารมณ์ ไม่ใช่แค่รายการคำสำคัญ คำแนะนำอย่างเป็นทางการแนะนำให้ระบุกล้อง เลนส์ แสง และสไตล์สำหรับภาพเสมือนจริง หรือสไตล์และจานสีสำหรับภาพประกอบ นอกจากนี้ ควรระบุข้อจำกัด (อัตราส่วนภาพ พื้นหลัง และข้อกำหนดข้อความ) อย่างชัดเจน
ฉันจะสร้างโครงสร้างคำกระตุ้นที่แข็งแกร่งได้อย่างไร
ต่อไปนี้เป็นเทมเพลตสั้น ๆ ที่สามารถใช้ซ้ำได้:
- เทมเพลตที่เหมือนจริง:
A photorealistic of , , in , illuminated by , captured with , emphasizing . Aspect ratio: . - เทมเพลตการถ่ายโอนสไตล์ / การเรียบเรียง:
Combine Image A (style) with Image B (subject). Transfer the color palette of A, keep subject proportions of B. Final style:.
เคล็ดลับทางวิศวกรรมแบบเร่งด่วน (รายการด่วน)
- ใช้ ประโยคบรรยายที่ชัดเจนหนึ่งประโยค มากกว่าแท็กที่ไม่ต่อเนื่องกันมากมาย
- เพิ่ม รายละเอียดกล้อง เพื่อความสมจริงของภาพ (เช่น "85 มม. ระยะชัดตื้น")
- เพื่อให้ตัวละครมีความสอดคล้องกันในการแก้ไขแต่ละครั้ง ให้อ้างอิงภาพก่อนหน้าและแอตทริบิวต์ที่คุณต้องการรักษาไว้ (เช่น "เก็บฝ้ากระและผ้าพันคอสีน้ำเงินของแบบไว้ เปลี่ยนทรงผมเป็น..." )
- เมื่อแก้ไขให้อัปโหลดรูปภาพต้นฉบับ และ อธิบายให้ชัดเจนว่าต้องการเปลี่ยนแปลงภูมิภาคหรือองค์ประกอบใดบ้าง
- ใช้การแก้ไขแบบวนซ้ำหลายรอบเพื่อปรับแต่งรายละเอียดภาพเล็กๆ น้อยๆ (Nano Banana รองรับการปรับแต่งการสนทนา)
หมายเหตุสุดท้าย
Nano Banana (Gemini 2.5 Flash Image) ถือเป็นก้าวกระโดดทางความคิดสร้างสรรค์ ช่วยให้ผู้สร้างสามารถรักษาความต่อเนื่องของตัวละครและผลิตภัณฑ์ได้ ขณะเดียวกันก็ช่วยให้สามารถแก้ไขภาพใหม่ๆ ได้อย่างโดดเด่น ผสานภาพหลายภาพเข้าด้วยกัน และทำซ้ำได้อย่างรวดเร็ว ใช้เพื่อเร่งการเล่าเรื่อง ลดความยุ่งยากในการผลิต และสร้างต้นแบบภาพได้อย่างรวดเร็ว แต่ควรผสานประโยชน์เหล่านี้เข้ากับการตรวจสอบอย่างเข้มงวดและหลักจริยธรรมอย่างเคร่งครัด
เริ่มต้นใช้งาน
CometAPI เป็นแพลตฟอร์ม API แบบรวมที่รวบรวมโมเดล AI มากกว่า 500 โมเดลจากผู้ให้บริการชั้นนำ เช่น ซีรีส์ GPT ของ OpenAI, Gemini ของ Google, Claude ของ Anthropic, Midjourney, Suno และอื่นๆ ไว้ในอินเทอร์เฟซเดียวที่เป็นมิตรกับนักพัฒนา ด้วยการนำเสนอการตรวจสอบสิทธิ์ การจัดรูปแบบคำขอ และการจัดการการตอบสนองที่สอดคล้องกัน CometAPI จึงทำให้การรวมความสามารถของ AI เข้ากับแอปพลิเคชันของคุณง่ายขึ้นอย่างมาก ไม่ว่าคุณจะกำลังสร้างแชทบ็อต เครื่องกำเนิดภาพ นักแต่งเพลง หรือไพพ์ไลน์การวิเคราะห์ที่ขับเคลื่อนด้วยข้อมูล CometAPI ช่วยให้คุณทำซ้ำได้เร็วขึ้น ควบคุมต้นทุน และไม่ขึ้นอยู่กับผู้จำหน่าย ทั้งหมดนี้ในขณะที่ใช้ประโยชน์จากความก้าวหน้าล่าสุดในระบบนิเวศ AI
นักพัฒนาสามารถเข้าถึงได้ ภาพแฟลช Gemini 2.5(รายการ Nano Banana CometAPI gemini-2.5-flash-image-preview/gemini-2.5-flash-image รายการสไตล์ในแคตตาล็อกของพวกเขา) ผ่าน CometAPI รุ่นล่าสุดที่ระบุไว้เป็นข้อมูล ณ วันที่เผยแพร่บทความ เริ่มต้นด้วยการสำรวจความสามารถของโมเดลใน สนามเด็กเล่น และปรึกษา คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนเข้าใช้งาน โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับรหัส API แล้ว โคเมทเอพีไอ เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ
