Gemini 2.5 Pro I/O Edition ถือเป็นการอัปเดตครั้งสำคัญสำหรับโมเดล AI เรือธงของ Google DeepMind โดยมอบความสามารถในการเขียนโค้ดที่ไม่มีใครเทียบได้ ความสามารถในการรับ/ส่งอินพุตที่ขยายเพิ่มขึ้น และเวิร์กโฟลว์สำหรับนักพัฒนาที่ได้รับการปรับปรุงให้ดีขึ้น รุ่นพรีวิวนี้เปิดตัวก่อนงาน Google I/O 2025 ซึ่งยกระดับการพัฒนาฟรอนต์เอนด์และ UI ด้วยการคว้าตำแหน่งสูงสุดใน WebDev Arena Leaderboard บรรลุความเข้าใจวิดีโอที่ล้ำสมัย และแนะนำการปรับปรุงที่มั่นคงในการเรียกใช้ฟังก์ชันและการลดข้อผิดพลาด มีราคาเท่ากับรุ่นก่อนหน้าที่ 1.25 ดอลลาร์ต่อโทเค็นหนึ่งล้านและ 10 ดอลลาร์ต่อโทเค็นหนึ่งล้าน จึงเป็นโซลูชันที่คุ้มต้นทุนเมื่อเทียบกับคู่แข่งในขณะที่ยังคงหน้าต่างบริบท 200,000 โทเค็นไว้ ฟังก์ชัน I/O หลายโหมด เช่น "วิดีโอเป็นโค้ด" และการสร้างแอปพร้อมท์เดียวทำให้การสร้างต้นแบบง่ายขึ้น และการรับรองจากผู้นำในอุตสาหกรรมเน้นย้ำถึงมูลค่าในทางปฏิบัติของรุ่นพรีวิวนี้ เมื่อมองไปข้างหน้า Google วางแผนที่จะขยายความจุบริบทและบูรณาการฟีเจอร์ I/O ขั้นสูง ตอกย้ำตำแหน่งของ Gemini ให้เป็นเครื่องมือที่ขาดไม่ได้สำหรับความท้าทายในการเขียนโค้ดในโลกแห่งความเป็นจริง
Gemini 2.5 Pro I/O Edition คืออะไร?
จุดเริ่มต้นและไทม์ไลน์การเปิดตัว
Gemini 2.5 Pro I/O Edition ได้รับการประกาศเมื่อวันที่ 6 พฤษภาคม 2025 โดยเป็นเวอร์ชันตัวอย่างที่ออกแบบมาเพื่อให้นักพัฒนาได้เริ่มต้นก่อนงานประชุมนักพัฒนาของ Google I/O ในเดือนนั้น เวอร์ชันนี้จะแทนที่เวอร์ชันวันที่ 25 มีนาคม (03) ด้วยเวอร์ชันอัปเดตที่มีชื่อว่า "25-05" โดยจะส่งต่อผู้ใช้ Gemini 06 Pro ที่มีอยู่ไปยังเวอร์ชันใหม่โดยอัตโนมัติโดยไม่ต้องดำเนินการใดๆ
อะไรที่ทำให้ I/O Edition แตกต่าง?
ต่างจากการอัปเดตมาตรฐานที่เน้นที่การเพิ่มประสิทธิภาพแบ็กเอนด์ รุ่น I/O เน้นที่ความสามารถในการเขียนโค้ดที่แข็งแกร่งขึ้นอย่างเห็นได้ชัดในทั้งการแปลงโค้ดแบบฟรอนต์เอนด์และแบบพื้นฐาน โดยแนะนำฟังก์ชัน I/O แบบมัลติโมดัลที่ปรับปรุงใหม่ เช่น การทำความเข้าใจวิดีโอและการสร้างแอปแบบโต้ตอบ ซึ่งขยายยูทิลิตี้ของโมเดลให้กว้างไกลเกินกว่าข้อความและโค้ดไปสู่โดเมนสื่อที่หลากหลายยิ่งขึ้น
หัวข้อหลักใน Gemini 2.5 Pro มีการปรับปรุงอะไรบ้าง?
ประสิทธิภาพการเขียนโค้ดได้รับการยกระดับอย่างไร?
Gemini 2.5 Pro มอบความสามารถในการสร้างและรีแฟกเตอร์โค้ดที่ "ได้รับการปรับปรุงอย่างมีนัยสำคัญ" ในปัจจุบัน โดยสามารถจัดการงานการปรับโครงสร้างแบ็คเอนด์ที่ซับซ้อนด้วยการแยกส่วนและตัวเลือกทางสถาปัตยกรรมในระดับ "นักพัฒนาอาวุโส" ในการประเมินประสิทธิภาพภายในของ Cognition พบว่า Gemini ผ่านการทดสอบขั้นสูงสำหรับนักพัฒนาเป็นครั้งแรก โดยแสดงให้เห็นถึงการออกแบบโมดูลใหม่ที่แข็งแกร่ง การเขียน API ใหม่ และการนำตรรกะหลายขั้นตอนไปใช้โดยไม่ต้องปรับแต่งเพิ่มเติม
ยิ่งไปกว่านั้น ความน่าเชื่อถือในการเรียกใช้ฟังก์ชันยังได้รับการปรับปรุงให้ดีขึ้นด้วย อัตราข้อผิดพลาดลดลงอย่างมากในขณะที่อัตราการทริกเกอร์เพิ่มขึ้น ทำให้สามารถสร้างเวิร์กโฟลว์ของเอเจนต์ที่เชื่อมโยงการเรียกใช้ฟังก์ชันหลายรายการได้ราบรื่นยิ่งขึ้น นักพัฒนาที่มีอยู่ซึ่งใช้ Gemini API จะพบว่าการเปลี่ยนแปลงเป็นไปอย่างราบรื่น เนื่องจากระบบจะตั้งค่าเริ่มต้นเป็นโมเดลที่อัปเกรดแล้วโดยอัตโนมัติโดยไม่ต้องเปลี่ยนแปลงโค้ดที่จำเป็นใดๆ
มีการเพิ่มความสามารถของ front‑end และ UI อะไรบ้าง?
ในแวดวงการพัฒนาแบบฟรอนต์เอนด์ Gemini 2.5 Pro ไต่ขึ้นสู่ตำแหน่งที่ 1 บนกระดานผู้นำ WebDev Arena ซึ่งเป็นการจัดอันดับความชอบของมนุษย์สำหรับโมเดล AI ในการสร้างแอปพลิเคชันเว็บที่ใช้งานได้และสวยงาม โดยแซงหน้า Claude 3.7 Sonnet และเวอร์ชันก่อนหน้าของ Gemini ไปด้วยคะแนน ELO มากกว่า 140 คะแนน
โมเดลนี้สามารถแปลงโมเดลการออกแบบให้เป็น HTML, CSS และ JavaScript ที่พร้อมใช้งานได้โดยอัตโนมัติ พร้อมด้วยเลย์เอาต์ที่ตอบสนองและการจัดรูปแบบที่สม่ำเสมอ โมเดลสามารถจดจำองค์ประกอบภาพ เช่น การโต้ตอบของปุ่ม การจัดวางตัวอักษร ระยะห่าง และแอนิเมชัน แล้วทำซ้ำได้อย่างแม่นยำเพื่อให้แน่ใจว่าโมดูล UI ใหม่จะผสมผสานกับระบบการออกแบบที่มีอยู่ได้อย่างลงตัว ตัวอย่างเช่น นักพัฒนาที่ใช้ Gemini 95 Starter App สามารถขอ "เครื่องเล่นวิดีโอที่ตรงกับรูปแบบ" และโมเดลจะอนุมานโทเค็นการออกแบบของโครงการและส่งออกส่วนประกอบที่พร้อมใช้งานภายในไม่กี่วินาที
Gemini 2.5 Pro ผสมผสานความเข้าใจวิดีโอกับการสร้างโค้ดได้อย่างไร
Gemini 2.5 Pro ขยายความสามารถมัลติโมดัลดั้งเดิมไปสู่วิดีโอ โดยทำคะแนนได้ 84.8 เปอร์เซ็นต์ในการทดสอบ VideoMME ใหม่ ซึ่งติดอันดับโมเดลขนาดใหญ่ที่ "เข้าใจวิดีโอ" ได้ดีที่สุดที่มีจำหน่าย ด้วยจุดแข็งนี้ นักพัฒนาสามารถจัดทำคลิป YouTube และรับแอปพลิเคชันการเรียนรู้หรือการสาธิตแบบโต้ตอบเต็มรูปแบบ ซึ่งประกอบด้วยเนื้อหาที่แยกออกมา หน้าจอ UI ที่กำหนดเอง และสคริปต์ตรรกะพื้นฐาน
การสาธิต "Video to Learning App" ของ Google AI Studio แสดงให้เห็นเวิร์กโฟลว์นี้: จะมีการแทรกวิดีโอการสอน จุดสำคัญต่างๆ จะถูกแมปไปยังโมดูลแบบโต้ตอบ และสร้างแอปการศึกษาที่เสร็จสมบูรณ์โดยไม่ต้องมีการแทรกแซงจากมนุษย์ ความก้าวหน้าครั้งนี้เป็นสัญญาณของการเปลี่ยนแปลงจาก "โค้ดที่ขับเคลื่อนด้วยภาษา" ไปสู่การสร้าง "ผลิตภัณฑ์ที่ขับเคลื่อนด้วยวิดีโอ" ในภูมิทัศน์ AI แบบหลายโหมด
นักพัฒนาสามารถเข้าถึง Gemini 2.5 Pro ได้จากที่ไหนและอย่างไร?
แพลตฟอร์มและรูปแบบการกำหนดราคาใดบ้างที่ใช้ได้?
Gemini 2.5 Pro I/O Edition วางจำหน่ายทันทีผ่าน Gemini API ใน Google AI Studio และผ่าน Vertex AI สำหรับลูกค้าองค์กร โดยรุ่นพรีวิวจะมีราคาเท่ากับรุ่นก่อนหน้า ซึ่งจะทำให้ผู้ใช้รุ่นแรกไม่ต้องเสียค่าใช้จ่ายเพิ่มเติม
ตามค่าเริ่มต้น การเรียกใช้ API ที่มีอยู่ทั้งหมดที่กำหนดเป้าหมายไปที่จุดสิ้นสุด Gemini 2.5 จะถูกส่งต่อไปยังโมเดล Pro ใหม่ (05-06) โดยอัตโนมัติ ทำให้ทีมพัฒนาไม่ต้องแบกรับภาระงานในการโยกย้ายข้อมูลอีกต่อไป การ์ดโมเดลโดยละเอียดที่บันทึกผลการประเมินประสิทธิภาพและการเปลี่ยนแปลงคุณลักษณะได้รับการเผยแพร่ควบคู่ไปกับการเปิดตัวเพื่อความโปร่งใส
CometAPI รองรับการเรียกใช้ Gemini 2.5 Pro I/O API แล้ว (ชื่อรุ่น: ggemini-2.5-pro-preview-05-06).
Gemini 2.5 Pro เปรียบเทียบกับคู่แข่งได้อย่างไร?

อันดับ WebDev Arena โดดเด่นขนาดไหน?
ด้วยคะแนน Arena Score ที่ 1419.95 Gemini 2.5 Pro เป็นผู้นำในบอร์ด WebDev Arena โดยแซงหน้า Claude 3.7 Sonnet (1357.10) และ GPT‑4.1 (1261.35) อย่างเห็นได้ชัด การก้าวกระโดดครั้งนี้สะท้อนให้เห็นถึงความต้องการของผู้ใช้ที่มีต่อการผสมผสานระหว่างความแม่นยำในการออกแบบ ความสามารถในการบำรุงรักษาโค้ด และการขัดเกลา UI ของ Gemini
เกณฑ์มาตรฐาน AI ที่กว้างขึ้นเผยให้เห็นอะไร?
นอกเหนือจาก front‑end แล้ว Gemini 2.5 Pro ยังขยายข้อได้เปรียบในด้านการใช้เหตุผลทั่วไปและการทดสอบการเข้ารหัสอีกด้วย ใน LMArena ซึ่งเป็นองค์ประกอบการทดสอบความเข้าใจและการแก้ปัญหาด้าน AI Gemini 39 Pro มีคะแนนนำคู่แข่งที่ใกล้เคียงที่สุดอยู่ XNUMX คะแนน ELO ตามที่ Demis Hassabis ซีอีโอของ Google DeepMind ระบุ
ความสามารถด้านหลายโหมดที่ครอบคลุมทั้งข้อความ เสียง รูปภาพ วิดีโอ และโค้ด ยังคงทำให้โดดเด่นในตลาดที่การใช้เหตุผลแบบ AI แบบบูรณาการกำลังกลายเป็นสิ่งสำคัญอย่างรวดเร็ว
กรณีการใช้งานในโลกแห่งความเป็นจริงใดบ้างที่เน้นย้ำถึงความสามารถของมัน?
การสร้างต้นแบบแอปจากข้อความแจ้งเตือนเพียงข้อความเดียว
หนึ่งในฟีเจอร์ที่ได้รับการยกย่องมากที่สุดของ I/O Edition คือความสามารถในการสร้างเว็บแอปแบบโต้ตอบเต็มรูปแบบจากคำสั่งเดียว ภายในแอป Gemini ผู้ใช้สามารถป้อนธีมการออกแบบหรือรูปแบบภาพและรับโค้ดที่สมบูรณ์สำหรับแอปพลิเคชันที่ใช้งานได้ ทำให้รอบการสร้างต้นแบบสั้นลงอย่างมาก
เวิร์กโฟลว์และการรวมระบบของตัวแทน
โมเดลที่ปรับปรุงใหม่นี้ช่วยขับเคลื่อนเวิร์กโฟลว์ของเอเจนต์ที่ซับซ้อน ซึ่งแสดงให้เห็นได้จากการบูรณาการกับเอเจนต์ Replit และเอเจนต์โค้ดของ Cursor ไพลน์ไลน์เหล่านี้ช่วยทำให้กระบวนการที่ซับซ้อน เช่น การรีแฟกเตอร์การกำหนดเส้นทางแบ็กเอนด์และการจัดรูปแบบส่วนประกอบ UI เป็นไปโดยอัตโนมัติโดยแทบไม่ต้องมีการแทรกแซงจากมนุษย์เลย
นักพัฒนาได้ให้ข้อเสนอแนะอะไรบ้าง?
การรับรองจากผู้นำในอุตสาหกรรม
Silas Alberti จาก Cognition ชื่นชมความเป็นผู้ใหญ่ของโมเดลนี้ โดยอ้างถึงความสามารถในการรีแฟกเตอร์ขนาดใหญ่ด้วยคุณภาพการตัดสินใจระดับสูง Michele Catasta จาก Replit เน้นย้ำถึงความสมดุลของ "ความสามารถที่เหนือกว่าความหน่วงเวลา" โดยระบุว่าโมเดลนี้เหมาะสำหรับงานที่ไวต่อความหน่วงเวลา Paul Couvert ผู้สอนด้าน AI และผู้ก่อตั้ง BlueShell และ Pietro Schirano ซีอีโอของ EverArt เน้นย้ำจุดแข็งของโมเดลนี้ในการสร้างโค้ดและ UI ผ่านการสนับสนุนทางโซเชียลมีเดีย
การบูรณาการในแพลตฟอร์มเช่น Replit และ Cursor
การทดสอบภายในของ Cursor แสดงให้เห็นข้อผิดพลาดในการเรียกใช้เครื่องมือน้อยลงและความน่าเชื่อถือที่เพิ่มขึ้น ทำให้บริษัทต้องรวม I/O Edition เข้ากับตัวแทนโค้ดหลัก ในทำนองเดียวกัน Replit กำลังสำรวจการผสานรวมที่ลึกซึ้งยิ่งขึ้นสำหรับความช่วยเหลือในการเขียนโค้ดแบบเรียลไทม์ โดยใช้ประโยชน์จากการเรียกฟังก์ชันที่ปรับปรุงแล้วของโมเดลและ I/O แบบหลายโหมด
เริ่มต้นใช้งาน
CometAPI ช่วยให้เข้าถึงโมเดล AI ได้มากกว่า 500 โมเดล รวมถึงโมเดลโอเพ่นซอร์สและโมเดลมัลติโมดัลเฉพาะทางสำหรับการแชท รูปภาพ โค้ด และอื่นๆ จุดแข็งหลักของ CometAPI อยู่ที่การทำให้กระบวนการบูรณาการ AI แบบดั้งเดิมซึ่งมีความซับซ้อนนั้นง่ายขึ้น ด้วย CometAPI การเข้าถึงเครื่องมือ AI ชั้นนำ เช่น Claude, OpenAI, Deepseek และ Gemini สามารถทำได้ผ่านการสมัครใช้งานแบบรวมศูนย์เพียงครั้งเดียว คุณสามารถใช้ API ใน CometAPI เพื่อสร้างเพลงและงานศิลปะ สร้างวิดีโอ และสร้างเวิร์กโฟลว์ของคุณเอง
โคเมทเอพีไอ เสนอราคาต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ API เจมินี่ 2.5 โปรและคุณจะได้รับ $1 ในบัญชีของคุณหลังจากลงทะเบียนและเข้าสู่ระบบ! ยินดีต้อนรับสู่การลงทะเบียนและสัมผัสกับ CometAPICometAPI จ่ายตามการใช้งานAPI เจมินี่ 2.5 โปร (ชื่อรุ่น : gemini-2.5-pro-preview-05-06) ใน CometAPI Pricing มีโครงสร้างดังนี้:
- อินพุตโทเค็น: $1 / M โทเค็น
- โทเค็นเอาต์พุต: $8 / M โทเค็น
สำหรับการบูรณาการอย่างรวดเร็ว โปรดดู เอกสาร API



