API เวอร์ชันพรีวิว Gemini 3 Pro

CometAPI
AnnaDec 10, 2025
API เวอร์ชันพรีวิว Gemini 3 Pro

Gemini 3 Pro (ตัวอย่าง) คือโมเดลการให้เหตุผลแบบหลายโหมดเรือธงใหม่ล่าสุดของ Google/DeepMind ในตระกูล Gemini 3 โมเดลนี้ถูกวางตำแหน่งให้เป็น "โมเดลที่ชาญฉลาดที่สุดเท่าที่เคยมีมา" ออกแบบมาสำหรับการให้เหตุผลเชิงลึก เวิร์กโฟลว์แบบเอเจนต์ การเขียนโค้ดขั้นสูง และความเข้าใจแบบหลายโหมดในบริบทยาว (ข้อความ รูปภาพ เสียง วิดีโอ โค้ด และการผสานรวมเครื่องมือ)

หัวข้อสำคัญ

  • รังสี: ข้อความ รูปภาพ วิดีโอ เสียง PDF (และเอาท์พุตเครื่องมือที่มีโครงสร้าง)
  • ตัวแทน/เครื่องมือ: การเรียกใช้ฟังก์ชันในตัว การค้นหาเป็นเครื่องมือ การรันโค้ด บริบท URL และการรองรับการประสานงานเอเจนต์แบบหลายขั้นตอน กลไกการคิดแบบลายเซ็นช่วยรักษาการใช้เหตุผลแบบหลายขั้นตอนในการเรียกใช้งาน
  • การเขียนโค้ดและ “การเขียนโค้ดแบบไวบ์”:ปรับให้เหมาะสมสำหรับการสร้างส่วนหน้า การสร้าง UI แบบอินเทอร์แอคทีฟ และการเขียนโค้ดแบบเอเจนต์ (ติดอันดับหนึ่งในตารางอันดับที่เกี่ยวข้องที่ Google รายงาน) ถือเป็นโมเดล "การเขียนโค้ดแบบไวบ์" ที่แข็งแกร่งที่สุดในตลาด
  • การควบคุมนักพัฒนาใหม่: thinking_level (ต่ำ|สูง) เพื่อแลกเปลี่ยนต้นทุน/เวลาแฝงกับความลึกของเหตุผล และ media_resolution ควบคุมความเที่ยงตรงแบบมัลติโมดัลต่อภาพหรือเฟรมวิดีโอ สิ่งเหล่านี้ช่วยสร้างสมดุลระหว่างประสิทธิภาพ ความหน่วง และต้นทุน

ประสิทธิภาพมาตรฐาน

  • Gemini3Pro ได้รับรางวัลชนะเลิศใน LMARE ด้วยคะแนน 1501 คะแนน แซงหน้า Grok-4.1-thinking ที่ได้ 1484 คะแนน และยังนำ Claude Sonnet 4.5 และ Opus 4.1 อีกด้วย
  • นอกจากนี้ยังได้อันดับหนึ่งในเวทีการเขียนโปรแกรม WebDevArena ด้วยคะแนน 1487 คะแนน
  • ในการสอบ Humanity's Last Exam ในด้านการใช้เหตุผลเชิงวิชาการ สามารถทำคะแนนได้ 37.5% (โดยไม่ใช้เครื่องมือ) ในการสอบวิทยาศาสตร์ GPQA Diamond ได้ 91.9% และในการแข่งขันคณิตศาสตร์ MathArena Apex ได้ 23.4% ซึ่งสร้างสถิติใหม่
  • ในด้านความสามารถแบบหลายโหมด MMMU-Pro บรรลุผลสำเร็จ 81% และในด้านความเข้าใจวิดีโอแบบ Video-MMMU บรรลุผลสำเร็จ 87.6%

API เวอร์ชันพรีวิว Gemini 3 Pro

รายละเอียดทางเทคนิคและสถาปัตยกรรม

  • พารามิเตอร์ “ระดับการคิด”: เจมินี่ 3 เปิดเผย thinking_level การควบคุมที่ช่วยให้นักพัฒนาสามารถแลกเปลี่ยนความลึกซึ้งของเหตุผลภายในกับความหน่วง/ต้นทุนได้ โมเดลนี้จัดการ thinking_level เป็นค่าเผื่อสัมพัทธ์สำหรับการใช้เหตุผลภายในแบบหลายขั้นตอน แทนที่จะเป็นการรับประกันโทเค็นที่เข้มงวด โดยทั่วไปแล้วค่าเริ่มต้นคือ high สำหรับ Pro นี่เป็นการควบคุมใหม่ที่ชัดเจนสำหรับนักพัฒนาเพื่อปรับแต่งการวางแผนหลายขั้นตอนและความลึกของห่วงโซ่ความคิด
  • ผลลัพธ์และเครื่องมือที่มีโครงสร้าง: แบบจำลองนี้รองรับ เอาท์พุต JSON ที่มีโครงสร้าง และสามารถใช้ร่วมกับเครื่องมือในตัวได้ (การค้นหา Google พื้นฐาน บริบท URL การรันโค้ด ฯลฯ) ฟีเจอร์เครื่องมือและเอาต์พุตแบบมีโครงสร้างบางอย่างจะแสดงตัวอย่างเท่านั้น gemini-3-pro-preview.
  • การบูรณาการแบบหลายโหมดและตัวแทน: Gemini 3 Pro ถูกสร้างขึ้นโดยเฉพาะสำหรับเวิร์กโฟลว์ของตัวแทน (เครื่องมือ + ตัวแทนหลายตัวบนโค้ด/เทอร์มินัล/เบราว์เซอร์)
  • ยอมรับข้อความ รูปภาพ วิดีโอ เสียง และอินพุต PDF และเอาท์พุตข้อความ

ข้อจำกัดและข้อควรระวังที่ทราบ

  1. ไม่ใช่ข้อเท็จจริงที่สมบูรณ์แบบ — ภาพหลอนยังคงเป็นไปได้ แม้ว่า Google จะอ้างว่ามีการปรับปรุงข้อเท็จจริงให้ดีขึ้นอย่างมาก แต่การยืนยันโดยผู้เชี่ยวชาญและการตรวจสอบโดยมนุษย์ยังคงมีความจำเป็นในสถานการณ์ที่มีความเสี่ยงสูง (ทางกฎหมาย ทางการแพทย์ ทางการเงิน)
  2. ประสิทธิภาพในบริบทยาวจะแตกต่างกันไปตามงาน การรองรับหน้าต่างอินพุต 1M ถือเป็นความสามารถที่ยาก แต่ประสิทธิภาพเชิงประจักษ์อาจลดลงในเกณฑ์มาตรฐานบางอย่างที่ความยาวสุดขั้ว (สังเกตได้ว่ามีการลดลงเป็นจุดๆ ที่ 1M ในการทดสอบบริบทระยะยาวบางอย่าง)
  3. การแลกเปลี่ยนระหว่างต้นทุนและเวลาแฝง บริบทขนาดใหญ่และสูงกว่า thinking_level การตั้งค่าจะเพิ่มการประมวลผล ความหน่วง และต้นทุน ระดับราคาจะใช้ตามปริมาณโทเค็น ใช้ thinking_level และกลยุทธ์การแบ่งกลุ่มเพื่อบริหารจัดการต้นทุน
  4. ตัวกรองความปลอดภัยและเนื้อหา Google ยังคงใช้มาตรการความปลอดภัยและชั้นการควบคุมดูแลต่อไป เนื้อหาและการกระทำบางอย่างยังคงถูกจำกัดหรือจะเปิดใช้งานโหมดปฏิเสธ

Gemini 3 Pro Preview เปรียบเทียบกับรุ่นท็อปอื่นๆ อย่างไร

การเปรียบเทียบระดับสูง (ดูตัวอย่าง → เชิงคุณภาพ):

พบกับ Gemini 2.5 Pro: การปรับปรุงแบบก้าวกระโดดในด้านการใช้เหตุผล การใช้เครื่องมือเชิงตัวแทน และการบูรณาการแบบหลายโหมด ช่วยเพิ่มการจัดการบริบทให้ครอบคลุมมากขึ้น และความเข้าใจในรูปแบบยาวที่ดีขึ้น DeepMind แสดงให้เห็นถึงความก้าวหน้าอย่างต่อเนื่องในด้านการใช้เหตุผลเชิงวิชาการ การเขียนโค้ด และงานแบบหลายโหมด

เทียบกับ GPT-5.1 และ Claude Sonnet 4.5 (ตามที่รายงาน): ในตารางเปรียบเทียบประสิทธิภาพของ Google/DeepMind Gemini 3 Pro ได้รับการนำเสนอว่าเป็นผู้นำในการวัดประสิทธิภาพแบบเอเจนต์ มัลติโมดัล และแบบบริบทยาวหลายแบบ (ดู Terminal-Bench, MMMU-Pro, AIME) ผลการเปรียบเทียบจะแตกต่างกันไปในแต่ละงาน


กรณีการใช้งานทั่วไปและมีมูลค่าสูง

  • การสรุปเอกสาร/หนังสือขนาดใหญ่และคำถามและคำตอบ: การรองรับบริบทยาวทำให้มีความน่าสนใจสำหรับทีมกฎหมาย การวิจัย และการปฏิบัติตามกฎระเบียบ
  • ความเข้าใจและการสร้างโค้ดในระดับที่เก็บข้อมูล: การบูรณาการกับเครื่องมือการเข้ารหัสและการใช้เหตุผลที่ได้รับการปรับปรุงช่วยให้สามารถรีแฟกเตอร์ฐานโค้ดขนาดใหญ่และเวิร์กโฟลว์การตรวจสอบโค้ดอัตโนมัติได้
  • ผู้ช่วยผลิตภัณฑ์หลายโหมด: เวิร์กโฟลว์รูปภาพ + ข้อความ + เสียง (การสนับสนุนลูกค้าที่รับภาพหน้าจอ คลิปเสียงการโทร และเอกสาร)
  • การสร้างและตัดต่อสื่อ (ภาพถ่าย → วิดีโอ): ฟีเจอร์ของตระกูล Gemini รุ่นก่อนหน้านี้ได้แก่ความสามารถด้านภาพถ่าย→วิดีโอสไตล์ Veo/Flow ตัวอย่างแนะนำการสร้างมัลติมีเดียที่ลึกซึ้งยิ่งขึ้นสำหรับต้นแบบและเวิร์กโฟลว์สื่อ

วิธีการเรียกใช้ API gemini-3-pro-preview จาก CometAPI

ราคา Gemini 3 Pro Preview ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ

อินพุตโทเค็น$1.60
โทเค็นเอาท์พุต$9.60

ขั้นตอนที่ต้องดำเนินการ

  • เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
  • ลงชื่อเข้าใช้ของคุณ คอนโซล CometAPI.
  • รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง

API เวอร์ชันพรีวิว Gemini 3 Pro

ใช้วิธีการ

  1. เลือก“gemini-3-pro-preview” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
  2. แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
  3. แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
  4. ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น

CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลอย่างราบรื่น รายละเอียดสำคัญสำหรับการแชท:

  • URL ฐาน: https://api.cometapi.com/v1/chat/completions
  • ชื่อรุ่น: gemini-3-pro-preview
  • รับรองความถูกต้อง: Bearer YOUR_CometAPI_API_KEY ส่วนหัว
  • ชนิดของเนื้อหา: application/json .

ดูสิ่งนี้ด้วย API GPT-5.1

SHARE THIS BLOG

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%