Google เปิดตัวโมเดล Imagen 4, Imagen 4 Ultra และ Veo 3 ในงาน Google I/O 2025

CometAPI
AnnaMay 18, 2025
Google เปิดตัวโมเดล Imagen 4, Imagen 4 Ultra และ Veo 3 ในงาน Google I/O 2025

Google เตรียมเปิดตัวโมเดล AI สร้างสรรค์รุ่นต่อไปภาพที่ 4, อิมเมจ 4 อุลตร้าและ วีโอ 3—ในระหว่างการประชุมนักพัฒนาประจำปีของ Google I/O 20 พฤษภาคม 2025การรั่วไหลของตัวระบุตัวอย่างในระยะเริ่มต้น (เช่น imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) ส่งสัญญาณการเปิดตัวแบบเป็นขั้นตอนและความสามารถหลายระดับทั้งในโดเมนการสังเคราะห์ภาพและวิดีโอ Imagen 4 มุ่งหวังที่จะมอบความก้าวหน้าที่สำคัญในด้านความสมจริงของภาพ ความเที่ยงตรงทันที และความสม่ำเสมอของสไตล์เมื่อเทียบกับ Imagen 3 ในขณะที่รุ่น "Ultra" อาจเสนอความละเอียดที่สูงกว่าหรือโหมดประสิทธิภาพเฉพาะทาง ในด้านวิดีโอ Veo 3 สัญญาว่าจะมีความต่อเนื่องของคลิปต่อคลิปที่สอดคล้องยิ่งขึ้นและการยึดมั่นในสไตล์ที่แข็งแกร่งเมื่อเทียบกับ Veo 2 คาดว่าทั้งสามรุ่นจะผสานรวมอย่างแน่นหนากับระบบนิเวศ Gemini AI ของ Google ช่วยให้เปลี่ยนจากข้อความแจ้งเตือนเป็นรูปภาพหรือวิดีโอได้อย่างราบรื่นภายในเวิร์กโฟลว์เดียวกัน


ตัวระบุตัวอย่างและกลยุทธ์การเปิดตัว

การแสดงตัวอย่างแบบเป็นขั้นตอน: การอ้างอิงภายใน เช่น

  • imagen-4.0-generate-preview-05-20
  • imagen-4.0-ultra-generate-exp-05-20
  • veo-3.0-generate-preview

Google เปิดตัวโมเดล Imagen 4, Imagen 4 Ultra และ Veo 3 ในงาน Google I/O 2025
Google เปิดตัวโมเดล Imagen 4, Imagen 4 Ultra และ Veo 3 ในงาน Google I/O 2025

ได้ปรากฏขึ้นในที่เก็บโค้ดและตัวอย่าง API ซึ่งบ่งชี้ถึงความตั้งใจของ Google ที่จะนำเสนอระดับประสิทธิภาพทั้งมาตรฐานและระดับ "อัลตรา" สำหรับการสร้างภาพ รวมไปถึงตัวอย่างโมเดลวิดีโอขั้นสูงสำหรับผู้ทดสอบในระยะเริ่มต้น

เปิดตัว Google I/O:

ตัวระบุเหล่านี้แนะนำอย่างยิ่งว่า Google จะจัดแสดงและอาจให้สิทธิ์การเข้าถึงแบบดูตัวอย่างแก่ผู้พัฒนาในงาน I/O 20 พฤษภาคม 2025ซึ่งสะท้อนการเปิดตัวครั้งก่อนสำหรับ Imagen 3 และ Veo 2


มีอะไรใหม่ใน Imagen 4

ความสมจริงของภาพและความเที่ยงตรง

  • การเรนเดอร์ที่ได้รับการปรับปรุง:มีรายงานว่า Imagen 4 ให้รายละเอียดที่สมจริงมากขึ้น ลดสิ่งแปลกปลอมและปรับปรุงความแม่นยำของสี ข่าวลือในช่วงแรกบ่งชี้ว่าสามารถทำความเข้าใจคำสั่งที่ซับซ้อนได้ดีขึ้น เช่น แสงที่มีความแตกต่างหรือการสะท้อน
  • การยึดมั่นอย่างฉับไว:คาดว่าโมเดลนี้จะปฏิบัติตามคำแนะนำของผู้ใช้อย่างแม่นยำยิ่งขึ้น โดยส่งมอบภาพที่ตรงกับทั้งเนื้อหาและรูปแบบมากขึ้น (เช่น "ภาพวาดสีน้ำมันพระอาทิตย์ตกเหนือภูเขา")

ความสม่ำเสมอของสไตล์

  • ความเหนียวแน่นของภาพหลายภาพ:Imagen 4 ได้รับการออกแบบมาเพื่อรักษารูปแบบภาพที่สอดคล้องกันในเอาท์พุตต่างๆ มากมาย ซึ่งเป็นประโยชน์ต่อกรณีการใช้งาน เช่น การสร้างสตอรี่บอร์ดหรือแค็ตตาล็อกผลิตภัณฑ์ ซึ่งความสม่ำเสมอถือเป็นสิ่งสำคัญ
  • อุลตร้าแวเรียนท์:ระดับ “Ultra” (imagen‑4.0‑ultra) น่าจะเสนอผลลัพธ์ที่มีความละเอียดสูงกว่าหรือการปรับแต่งเฉพาะทาง (เช่น ความเที่ยงตรงสูงพิเศษสำหรับสื่อสิ่งพิมพ์) สำหรับองค์กรและมืออาชีพด้านความคิดสร้างสรรค์

มีอะไรใหม่ใน Veo 3

ปรับปรุงการเชื่อมโยงกัน

  • ความต่อเนื่องของคลิปต่อคลิป:Veo 3 มีเป้าหมายเพื่อสร้างลำดับวิดีโอโดยที่การถ่ายต่อเนื่องจะรักษาการจัดองค์ประกอบ แสง และลักษณะของตัวละครให้สอดคล้องกัน โดยแก้ไขข้อจำกัดใน Veo 2 เกี่ยวกับการดริฟต์ของภาพตามระยะเวลา
  • สไตล์ ฟิเดลิตี้:โมเดลนี้เน้นที่การจำลองสไตล์ศิลปะหรือภาพยนตร์ได้อย่างสมจริงยิ่งขึ้น ทำให้การผลิตวิดีโอในรูปแบบสุนทรียศาสตร์ที่ต้องการ (เช่น แอนิเมชั่นแบบนัวร์ หรือพาสเทล) ง่ายขึ้น

การบูรณาการของ SynthID Watermarking

  • ลายน้ำดิจิตอล:โดยใช้ประโยชน์จากเทคโนโลยี SynthID ของ DeepMind (เปิดตัวพร้อมกับ Veo 2) Veo 3 จะฝังลายน้ำที่มองไม่เห็นเพื่อช่วยระบุเนื้อหาที่สร้างโดย AI และยับยั้งการใช้งานที่ผิด

การบูรณาการกับ Gemini AI

  • การเข้าถึงที่ราบรื่นคาดว่าทั้ง Imagen 4 และ Veo 3 จะสามารถเข้าถึงได้โดยตรงผ่านอินเทอร์เฟซ Gemini ของ Google ซึ่งจะช่วยให้ผู้ใช้สามารถสร้างรูปภาพหรือวิดีโอภายในข้อความแจ้งเตือนแบบแชทหรือผ่านอินเทอร์เฟซผลิตภัณฑ์เช่น Google Photos และ Google Slides
  • อัญมณีราศีเมถุน:AI “Gems” ที่กำหนดเองอาจรวมโมเดลเหล่านี้ไว้ ซึ่งจะช่วยให้ผู้ใช้สามารถสร้างผู้ช่วยเฉพาะทาง (เช่น Gems สำหรับการวางแผนการเดินทางที่สร้างรูปภาพแผนการเดินทางและวิดีโอภาพรวม) และแบ่งปันในตลาดที่คล้ายกับ GPT Store ของ ChatGPT

ความพร้อมใช้งานและขั้นตอนถัดไป

สาธารณะก่อน:นักพัฒนาและผู้ทดสอบระดับองค์กรอาจได้รับคำเชิญให้ทดลองใช้ Imagen 4 (มาตรฐานและ Ultra) และ Veo 3 เริ่มต้น 20 พฤษภาคม 2025 ในงาน Google I/O และจะเปิดตัวในวงกว้างให้กับ Labs และ Vertex AI ในอีกไม่กี่สัปดาห์ข้างหน้านี้

ข้อเสนอแนะและการทำซ้ำ:เช่นเดียวกับการเปิดตัวครั้งก่อนๆ Google น่าจะขอคำติชมจากผู้ใช้เพื่อปรับปรุงฟิลเตอร์ความปลอดภัย ความทนทานของลายน้ำ และเพิ่มประสิทธิภาพการทำงานก่อนที่จะพร้อมใช้งานโดยทั่วไป

ดูอวกาศนี้:ผู้พัฒนาที่สนใจควรตรวจสอบ โคเมทเอพีไอ.

API รุ่นใหม่จะแสดงรายการบน CometAPI และสัญญาว่าจะให้ราคาที่ต่ำกว่า Google เพื่ออำนวยความสะดวกในการผสานรวมของคุณ โปรดติดตามต่อไป เอกสาร API.

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%