Google เตรียมเปิดตัวโมเดล AI สร้างสรรค์รุ่นต่อไปภาพที่ 4, อิมเมจ 4 อุลตร้าและ วีโอ 3—ในระหว่างการประชุมนักพัฒนาประจำปีของ Google I/O 20 พฤษภาคม 2025การรั่วไหลของตัวระบุตัวอย่างในระยะเริ่มต้น (เช่น imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) ส่งสัญญาณการเปิดตัวแบบเป็นขั้นตอนและความสามารถหลายระดับทั้งในโดเมนการสังเคราะห์ภาพและวิดีโอ Imagen 4 มุ่งหวังที่จะมอบความก้าวหน้าที่สำคัญในด้านความสมจริงของภาพ ความเที่ยงตรงทันที และความสม่ำเสมอของสไตล์เมื่อเทียบกับ Imagen 3 ในขณะที่รุ่น "Ultra" อาจเสนอความละเอียดที่สูงกว่าหรือโหมดประสิทธิภาพเฉพาะทาง ในด้านวิดีโอ Veo 3 สัญญาว่าจะมีความต่อเนื่องของคลิปต่อคลิปที่สอดคล้องยิ่งขึ้นและการยึดมั่นในสไตล์ที่แข็งแกร่งเมื่อเทียบกับ Veo 2 คาดว่าทั้งสามรุ่นจะผสานรวมอย่างแน่นหนากับระบบนิเวศ Gemini AI ของ Google ช่วยให้เปลี่ยนจากข้อความแจ้งเตือนเป็นรูปภาพหรือวิดีโอได้อย่างราบรื่นภายในเวิร์กโฟลว์เดียวกัน
ตัวระบุตัวอย่างและกลยุทธ์การเปิดตัว
การแสดงตัวอย่างแบบเป็นขั้นตอน: การอ้างอิงภายใน เช่น
imagen-4.0-generate-preview-05-20imagen-4.0-ultra-generate-exp-05-20veo-3.0-generate-preview


ได้ปรากฏขึ้นในที่เก็บโค้ดและตัวอย่าง API ซึ่งบ่งชี้ถึงความตั้งใจของ Google ที่จะนำเสนอระดับประสิทธิภาพทั้งมาตรฐานและระดับ "อัลตรา" สำหรับการสร้างภาพ รวมไปถึงตัวอย่างโมเดลวิดีโอขั้นสูงสำหรับผู้ทดสอบในระยะเริ่มต้น
เปิดตัว Google I/O:
ตัวระบุเหล่านี้แนะนำอย่างยิ่งว่า Google จะจัดแสดงและอาจให้สิทธิ์การเข้าถึงแบบดูตัวอย่างแก่ผู้พัฒนาในงาน I/O 20 พฤษภาคม 2025ซึ่งสะท้อนการเปิดตัวครั้งก่อนสำหรับ Imagen 3 และ Veo 2
มีอะไรใหม่ใน Imagen 4
ความสมจริงของภาพและความเที่ยงตรง
- การเรนเดอร์ที่ได้รับการปรับปรุง:มีรายงานว่า Imagen 4 ให้รายละเอียดที่สมจริงมากขึ้น ลดสิ่งแปลกปลอมและปรับปรุงความแม่นยำของสี ข่าวลือในช่วงแรกบ่งชี้ว่าสามารถทำความเข้าใจคำสั่งที่ซับซ้อนได้ดีขึ้น เช่น แสงที่มีความแตกต่างหรือการสะท้อน
- การยึดมั่นอย่างฉับไว:คาดว่าโมเดลนี้จะปฏิบัติตามคำแนะนำของผู้ใช้อย่างแม่นยำยิ่งขึ้น โดยส่งมอบภาพที่ตรงกับทั้งเนื้อหาและรูปแบบมากขึ้น (เช่น "ภาพวาดสีน้ำมันพระอาทิตย์ตกเหนือภูเขา")
ความสม่ำเสมอของสไตล์
- ความเหนียวแน่นของภาพหลายภาพ:Imagen 4 ได้รับการออกแบบมาเพื่อรักษารูปแบบภาพที่สอดคล้องกันในเอาท์พุตต่างๆ มากมาย ซึ่งเป็นประโยชน์ต่อกรณีการใช้งาน เช่น การสร้างสตอรี่บอร์ดหรือแค็ตตาล็อกผลิตภัณฑ์ ซึ่งความสม่ำเสมอถือเป็นสิ่งสำคัญ
- อุลตร้าแวเรียนท์:ระดับ “Ultra” (imagen‑4.0‑ultra) น่าจะเสนอผลลัพธ์ที่มีความละเอียดสูงกว่าหรือการปรับแต่งเฉพาะทาง (เช่น ความเที่ยงตรงสูงพิเศษสำหรับสื่อสิ่งพิมพ์) สำหรับองค์กรและมืออาชีพด้านความคิดสร้างสรรค์
มีอะไรใหม่ใน Veo 3
ปรับปรุงการเชื่อมโยงกัน
- ความต่อเนื่องของคลิปต่อคลิป:Veo 3 มีเป้าหมายเพื่อสร้างลำดับวิดีโอโดยที่การถ่ายต่อเนื่องจะรักษาการจัดองค์ประกอบ แสง และลักษณะของตัวละครให้สอดคล้องกัน โดยแก้ไขข้อจำกัดใน Veo 2 เกี่ยวกับการดริฟต์ของภาพตามระยะเวลา
- สไตล์ ฟิเดลิตี้:โมเดลนี้เน้นที่การจำลองสไตล์ศิลปะหรือภาพยนตร์ได้อย่างสมจริงยิ่งขึ้น ทำให้การผลิตวิดีโอในรูปแบบสุนทรียศาสตร์ที่ต้องการ (เช่น แอนิเมชั่นแบบนัวร์ หรือพาสเทล) ง่ายขึ้น
การบูรณาการของ SynthID Watermarking
- ลายน้ำดิจิตอล:โดยใช้ประโยชน์จากเทคโนโลยี SynthID ของ DeepMind (เปิดตัวพร้อมกับ Veo 2) Veo 3 จะฝังลายน้ำที่มองไม่เห็นเพื่อช่วยระบุเนื้อหาที่สร้างโดย AI และยับยั้งการใช้งานที่ผิด
การบูรณาการกับ Gemini AI
- การเข้าถึงที่ราบรื่นคาดว่าทั้ง Imagen 4 และ Veo 3 จะสามารถเข้าถึงได้โดยตรงผ่านอินเทอร์เฟซ Gemini ของ Google ซึ่งจะช่วยให้ผู้ใช้สามารถสร้างรูปภาพหรือวิดีโอภายในข้อความแจ้งเตือนแบบแชทหรือผ่านอินเทอร์เฟซผลิตภัณฑ์เช่น Google Photos และ Google Slides
- อัญมณีราศีเมถุน:AI “Gems” ที่กำหนดเองอาจรวมโมเดลเหล่านี้ไว้ ซึ่งจะช่วยให้ผู้ใช้สามารถสร้างผู้ช่วยเฉพาะทาง (เช่น Gems สำหรับการวางแผนการเดินทางที่สร้างรูปภาพแผนการเดินทางและวิดีโอภาพรวม) และแบ่งปันในตลาดที่คล้ายกับ GPT Store ของ ChatGPT
ความพร้อมใช้งานและขั้นตอนถัดไป
สาธารณะก่อน:นักพัฒนาและผู้ทดสอบระดับองค์กรอาจได้รับคำเชิญให้ทดลองใช้ Imagen 4 (มาตรฐานและ Ultra) และ Veo 3 เริ่มต้น 20 พฤษภาคม 2025 ในงาน Google I/O และจะเปิดตัวในวงกว้างให้กับ Labs และ Vertex AI ในอีกไม่กี่สัปดาห์ข้างหน้านี้
ข้อเสนอแนะและการทำซ้ำ:เช่นเดียวกับการเปิดตัวครั้งก่อนๆ Google น่าจะขอคำติชมจากผู้ใช้เพื่อปรับปรุงฟิลเตอร์ความปลอดภัย ความทนทานของลายน้ำ และเพิ่มประสิทธิภาพการทำงานก่อนที่จะพร้อมใช้งานโดยทั่วไป
ดูอวกาศนี้:ผู้พัฒนาที่สนใจควรตรวจสอบ โคเมทเอพีไอ.
API รุ่นใหม่จะแสดงรายการบน CometAPI และสัญญาว่าจะให้ราคาที่ต่ำกว่า Google เพื่ออำนวยความสะดวกในการผสานรวมของคุณ โปรดติดตามต่อไป เอกสาร API.
