นวัตกรรมที่น่าตื่นเต้นที่ Google I/O 2025: การประกาศสำคัญ

CometAPI
AnnaMay 21, 2025
นวัตกรรมที่น่าตื่นเต้นที่ Google I/O 2025: การประกาศสำคัญ

Google I/O 2025 ถือเป็นการเปลี่ยนแปลงครั้งสำคัญสู่ประสบการณ์ที่ขับเคลื่อนด้วย AI ทั่วทั้งระบบนิเวศของ Google โดยเปิดเผยการอัปเดตครั้งสำคัญสำหรับโมเดล AI เรือธง Gemini การปรับปรุงเครื่องมือสำหรับนักพัฒนา และการแนะนำคุณสมบัติที่เน้น AI ใน Search, Workspace และ Chrome นวัตกรรมสำคัญ ได้แก่ Gemini Live สำหรับความช่วยเหลือแบบหลายโหมด โหมด AI ในการค้นหาสำหรับการโต้ตอบแบบสนทนา และ Google Beam สำหรับการโทรวิดีโอ 3 มิติ ควบคู่ไปกับเครื่องมือใหม่ เช่น Jules สำหรับการเข้ารหัสด้วยความช่วยเหลือของ AI และ Imagen 4 สำหรับการสร้างภาพที่มีความเที่ยงตรงสูง ในด้านฮาร์ดแวร์ แพลตฟอร์ม Android XR แสดงให้เห็นถึงการลงทุนใหม่ของ Google ในแว่นตาอัจฉริยะ ขณะที่ตัวอย่าง Android 16 และ Pixel Fold แสดงให้เห็นถึงการบูรณาการ AI ทั่วทั้งระบบที่ลึกซึ้งยิ่งขึ้น เพื่อรองรับความก้าวหน้าเหล่านี้ Google ได้เปิดตัวแผนการสมัครสมาชิก AI แบบแบ่งระดับ AI Pro ในราคา 20 เหรียญสหรัฐฯ ต่อเดือนและ AI Ultra ในราคา 250 เหรียญสหรัฐฯ ต่อเดือน ซึ่งเน้นย้ำถึงการเคลื่อนไหวเพื่อสร้างรายได้จากบริการ AI ระดับพรีเมียม ในที่สุด Google ก็ได้เน้นย้ำถึงความมุ่งมั่นในการทำความดีเพื่อสังคมด้วยการตรวจจับไฟป่าที่ขับเคลื่อนด้วย AI ผ่านทาง Fire Sat และการทดลองบรรเทาทุกข์จากภัยพิบัติโดยใช้โดรนผ่านทาง Wing


AI และวิวัฒนาการของเจมินี่

ราศีเมถุน 2.5 ขึ้นไป

Gemini ซึ่งเป็นผู้ช่วย AI รุ่นถัดไปของ Google ได้พัฒนามาถึงเวอร์ชัน 2.5 แล้ว โดยมีการปรับปรุงการใช้เหตุผลอย่างมีนัยสำคัญ (ชื่อรุ่น: gemini-2.5-flash-preview-05-20), ความเข้าใจหลายโหมด และความหน่วง

Flash Preview ของ Gemini 2.5 ช่วยให้นักพัฒนาซอฟต์แวร์ตอบสนองได้เร็วขึ้นในงานเขียนโค้ดและงานที่ซับซ้อน สรุปความคิดและ "งบประมาณการคิด" ที่กำลังจะมีขึ้นช่วยให้มีความโปร่งใสและควบคุมต้นทุนในการอนุมานแบบจำลองได้

ในกลุ่มผู้บริโภค Gemini Live ผสานกล้อง เสียง และข้อมูลเว็บไซต์เข้าด้วยกันเพื่อดำเนินการงานตามบริบทแบบเรียลไทม์ ซึ่งช่วยให้สามารถแปลหรือระบุวัตถุได้ทันทีผ่านฟีดกล้องของโทรศัพท์

โครงการแอสตร้าและมาริเนอร์

โครงการ Astra มีเป้าหมายเพื่อสร้างอินเทอร์เฟซ AI สากลที่สามารถเข้าใจสัญญาณภาพและตอบสนองโดยตรงต่อการโต้ตอบบนหน้าจอ โดยก้าวข้ามข้อความหรือคำแนะนำด้วยเสียง ในขณะเดียวกัน โครงการ Mariner ทำให้เวิร์กโฟลว์ประจำวันเป็นแบบอัตโนมัติ เช่น การจองนัดหมายและการช้อปปิ้งออนไลน์ โดยใช้ AI จัดการงานหลายขั้นตอนโดยอัตโนมัติ


เครื่องมือที่เน้นนักพัฒนา

จูลส์และอิเมเจน 4

สำหรับนักพัฒนา Jules ได้รับการแนะนำในฐานะผู้ช่วยเขียนโค้ดที่ขับเคลื่อนด้วย AI ซึ่งรวมเข้ากับ Android Studio อย่างแนบแน่น โดยให้คำแนะนำโค้ดที่คำนึงถึงบริบทและการรีแฟกเตอร์อัตโนมัติ ภาพที่ 4ซึ่งเป็นเวอร์ชันใหม่ล่าสุดของโมเดลการสร้างรูปภาพของ Google มอบรายละเอียดและการควบคุมสไตล์ที่ไม่เคยมีมาก่อน ตอบโจทย์ทั้งศิลปินและนักออกแบบ UI

โฟลว์และวีโอ 3

Google จัดแสดง ไหล และ วีโอ 3เครื่องมือสร้างวิดีโอที่ขับเคลื่อนด้วย AI ที่แปลงข้อความแจ้งเตือนหรือสตอรี่บอร์ดเป็นแอนิเมชั่นคุณภาพสูง และ ตะเข็บซึ่งสร้างโมเดล UI ที่ตอบสนองได้จากภาพร่างที่เรียบง่าย เครื่องมือเหล่านี้เน้นย้ำถึงความพยายามของ Google ในการสร้างเนื้อหาสร้างสรรค์ที่เข้าถึงประชาชนได้มากขึ้นโดยใช้ AI

นวัตกรรมที่น่าตื่นเต้นที่ Google I/O 2025: การประกาศสำคัญ


การค้นหา พื้นที่ทำงาน และ Chrome

โหมด AI ในการค้นหา

ปรับปรุงใหม่ โหมด AI สำหรับ Google Search จะแสดงคำตอบในรูปแบบสนทนา โดยจะค้นหาข้อมูลแบบไดนามิกผ่านเนื้อหาบนเว็บและข้อมูลส่วนบุคคล (เช่น อีเมล รายการปฏิทิน) เพื่อให้ได้คำตอบที่ตรงตามความต้องการของผู้ใช้ นอกจากนี้ ยังมีการสาธิตฟีเจอร์การช้อปปิ้ง AR แบบทดลองใน Search อีกด้วย ซึ่งช่วยให้ผู้ใช้ลองสินค้าได้ก่อนตัดสินใจซื้อ

การปรับปรุงพื้นที่ทำงาน

เปิดตัว Gmail การตอบกลับอัจฉริยะแบบเฉพาะบุคคล ซึ่งเลียนแบบรูปแบบการเขียนของผู้ใช้แต่ละคน ขณะที่ Meet นำเสนอการแปลสดในกว่า 20 ภาษา ขับเคลื่อนโดย AI บนอุปกรณ์เพื่อลดเวลาแฝงและความเป็นส่วนตัวที่เพิ่มขึ้น Google Docs และ Sheets จะรวมผู้ช่วย AI เชิงสร้างสรรค์สำหรับการร่างเนื้อหาและทำงานวิเคราะห์ข้อมูลโดยอัตโนมัติในเร็วๆ นี้


นวัตกรรมด้านฮาร์ดแวร์

แว่นตาอัจฉริยะ Android XR

ภายใต้ แอนดรอยด์ XR Google ได้แสดงให้เห็นถึงความร่วมมือกับ Gentle Monster และ Warby Parker เพื่อเปิดตัวแว่นตาอัจฉริยะรุ่นใหม่ที่มาพร้อมระบบนำทาง AR การแจ้งเตือนตามบริบท และการซ้อนภาพการแปลแบบเรียลไทม์ SDK ของแพลตฟอร์มพร้อมให้นักพัฒนาสร้างประสบการณ์ที่ดื่มด่ำได้แล้ว

Pixel Fold และตัวอย่าง Android 16

ตัวอย่างนักพัฒนาของ Android 16 นำเสนอ API ระบบ AI-first ใหม่ รวมถึงการแจ้งเตือนตามบริบทแวดล้อมและวอลเปเปอร์แบบสร้างสรรค์ทั่วทั้งระบบ นอกจากนี้ Google ยังเปิดเผยรายละเอียดเกี่ยวกับการเปิดตัวที่จะเกิดขึ้นเร็วๆ นี้ พิกเซลพับเน้นการบูรณาการ AI อย่างราบรื่นสำหรับการถ่ายภาพและการทำงานหลายอย่างพร้อมกัน


แผนการสมัครสมาชิกและราคา

Google ประกาศเปิดตัวรูปแบบการสมัครสมาชิกแบบแบ่งระดับสำหรับบริการ AI ขั้นสูง:

  • เอไอโปร ด้วยราคา 20 เหรียญสหรัฐฯ ต่อเดือน พร้อมขยายขีดจำกัดการใช้งาน Gemini และสิทธิ์การเข้าถึงฟีเจอร์ใหม่ก่อนใคร
  • เอไอ อุลตร้า ที่ราคา 250 ดอลลาร์ต่อเดือน ซึ่งรวมถึงทรัพยากร GPU เฉพาะและ SLA ระดับองค์กรสำหรับแอปพลิเคชันที่สำคัญต่อภารกิจ

กลยุทธ์นี้สะท้อนให้เห็นถึงการเปลี่ยนแปลงของ Google ในการสร้างรายได้จากความสามารถ AI แบบพรีเมียมในขณะที่ยังคงระดับบริการฟรีสำหรับการนำไปใช้ในวงกว้าง

Google I/O 2025 แสดงให้เห็นถึงความมุ่งมั่นของ Google ในการฝัง AI ลงในแพลตฟอร์มต่างๆ โดยสร้างสมดุลระหว่างเครื่องมือสำหรับนักพัฒนาที่ล้ำสมัย ฟีเจอร์สำหรับผู้บริโภค และโครงการเพื่อผลกระทบทางสังคม เมื่อเทคโนโลยีเหล่านี้เปิดตัวในอีกไม่กี่เดือนข้างหน้า เทคโนโลยีเหล่านี้สัญญาว่าจะกำหนดนิยามใหม่ว่าผู้ใช้โต้ตอบกับข้อมูล ความคิดสร้างสรรค์ และอุปกรณ์อย่างไรในโลกที่ให้ความสำคัญกับ AI เป็นหลัก

เริ่มต้นใช้งาน

CometAPI มอบอินเทอร์เฟซ REST แบบรวมที่รวบรวมโมเดล AI หลายร้อยโมเดล รวมถึงตระกูล Gemini ภายใต้จุดสิ้นสุดที่สอดคล้องกัน พร้อมการจัดการคีย์ API ในตัว โควตาการใช้งาน และแดชบอร์ดการเรียกเก็บเงิน แทนที่จะต้องจัดการ URL และข้อมูลรับรองของผู้ขายหลายราย

นักพัฒนาสามารถเข้าถึงได้ API ของ Gemini 2.5 Flash เบื้องต้น  (รุ่นล่าสุด: gemini-2.5-flash-preview-05-20) และ API เจมินี่ 2.5 โปร ฯลฯ ผ่านทาง โคเมทเอพีไอในการเริ่มต้น ให้สำรวจความสามารถของโมเดลใน Playground และดู คู่มือ API สำหรับคำแนะนำโดยละเอียด โปรดทราบว่านักพัฒนาบางคนอาจจำเป็นต้องตรวจสอบองค์กรของตนก่อนใช้โมเดลนี้

SHARE THIS BLOG

อ่านเพิ่มเติม

GPT-5.2 เทียบกับ Gemini 3 Pro: ตัวไหนดีกว่าในปี 2026?
January 21, 1970
gpt-5-2
gemini-3-pro-preview

GPT-5.2 เทียบกับ Gemini 3 Pro: ตัวไหนดีกว่าในปี 2026?

ณ วันที่ 15 ธันวาคม 2025 ข้อเท็จจริงสาธารณะชี้ว่า Google’s Gemini 3 Pro (preview) และ OpenAI’s GPT-5.2 ต่างได้ขยายขอบเขตใหม่ในด้านการให้เหตุผล มัลติโหมด และการทำงานกับบริบทยาว — แต่ทั้งคู่ใช้แนวทางวิศวกรรมที่ต่างกัน (Gemini → sparse MoE + บริบทขนาดใหญ่; GPT-5.2 → การออกแบบแบบ dense/“routing”, การบีบอัด และโหมดการให้เหตุผลแบบ x-high) และจึงต้องแลกเปลี่ยนระหว่างชัยชนะสูงสุดบน benchmark กับความคาดการณ์ได้ทางวิศวกรรม เครื่องมือ และระบบนิเวศ สิ่งใด “ดีกว่า” ขึ้นอยู่กับความต้องการหลักของคุณ: แอปพลิเคชันเชิงตัวแทนแบบมัลติโหมดที่ต้องใช้บริบทสุดขีดโน้มเอียงไปทาง Gemini 3 Pro; ส่วนเครื่องมือสำหรับนักพัฒนาระดับองค์กรที่เสถียร ต้นทุนที่คาดการณ์ได้ และความพร้อมใช้งานของ API ทันที เอื้อให้ GPT-5.2

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%