ข้อมูลจำเพาะทางเทคนิคของ Gemini 3.5 Flash
| รายการ | Gemini 3.5 Flash |
|---|---|
| ผู้ให้บริการ | |
| ตระกูลโมเดล | Gemini 3.5 |
| รหัสโมเดลอย่างเป็นทางการ | gemini-3.5-flash |
| ชนิดอินพุต | ข้อความ, รูปภาพ, วิดีโอ, เสียง, PDF |
| ชนิดเอาต์พุต | ข้อความ |
| หน้าต่างบริบท | 1 ล้านโทเค็น |
| จำนวนโทเค็นเอาต์พุตสูงสุด | ~65K โทเค็นเอาต์พุต |
| จุดเด่นหลัก | เวิร์กโฟลว์แบบเอเจนต์, การเขียนโค้ด, การให้เหตุผลแบบมัลติโหมด |
| การรองรับเครื่องมือ | การเรียกใช้ฟังก์ชัน, การรันโค้ด, การยึดโยงด้วยการค้นหา, ผลลัพธ์แบบมีโครงสร้าง, บริบทจาก URL, การค้นหาไฟล์ |
| การรองรับการคิด | ระดับการคิด/การให้เหตุผลที่ปรับได้ |
| กรอบความปลอดภัย | Google Frontier Safety Framework |
Gemini 3.5 Flash คืออะไร?
Google Gemini 3.5 Flash คือโมเดลการให้เหตุผลแบบมัลติโหมดความเร็วสูงระดับเรือธงของ Google ที่ได้รับการปรับให้เหมาะกับการดำเนินงานแบบเอเจนต์ การเขียนโค้ด และเวิร์กโฟลว์ระยะยาว ขยายความสามารถของตระกูล Gemini Flash ด้วยศักยภาพด้านการให้เหตุผลและวิศวกรรมซอฟต์แวร์ที่แข็งแกร่งยิ่งขึ้น พร้อมคงลักษณะเวลาแฝงต่ำในการอนุมาน
แตกต่างจากโมเดล Flash รุ่นก่อนที่มุ่งเน้นการอนุมานที่เบาเป็นหลัก Gemini 3.5 Flash ถูกออกแบบมาสำหรับเอเจนต์ AI แบบถาวร ระบบเขียนโค้ดหลายขั้นตอน และไปป์ไลน์ระบบอัตโนมัติสำหรับองค์กร Google วางตำแหน่งให้เป็นโมเดลระดับ Flash ที่เน้นเอเจนต์ซึ่งแข็งแกร่งที่สุดของตนจนถึงปัจจุบัน
คุณสมบัติหลักของ Gemini 3.5 Flash
- รองรับบริบทยาว 1M โทเค็น: จัดการที่เก็บขนาดใหญ่มาก เอกสารยาว PDF ถอดความ และเวิร์กโฟลว์หลายเซสชันได้ภายในบริบทพรอมต์เดียว
- การดำเนินงานแบบเอเจนต์ที่แข็งแกร่ง: ปรับแต่งเพื่อเวิร์กโฟลว์อัตโนมัติหลายขั้นตอน การประสานเครื่องมือ งานเทอร์มินัล และเอเจนต์ AI ที่ทำงานยาว
- ประสิทธิภาพการเขียนโค้ดขั้นสูง: ทำคะแนนเหนือ Gemini 3.1 Pro ในหลายเบนช์มาร์กด้านโค้ดและเอเจนต์ เช่น Terminal-Bench และ MCP Atlas
- การให้เหตุผลแบบมัลติโหมดแบบเนทีฟ: รองรับข้อความ รูปภาพ เสียง วิดีโอ และ PDF เพื่อการให้เหตุผลแบบรวม
- เครื่องมือระดับการใช้งานจริง (production): รองรับผลลัพธ์แบบมีโครงสร้าง การเรียกใช้ฟังก์ชัน การรันโค้ด การยึดโยงด้วย Google Search และ Maps และการค้นหาไฟล์
- โหมดการให้เหตุผล/การคิดที่กำหนดค่าได้: นักพัฒนาสามารถปรับสมดุลระหว่างเวลาแฝงกับความลึกของการให้เหตุผลผ่านตัวควบคุมระดับการคิด
ประสิทธิภาพตามเบนช์มาร์กของ Gemini 3.5 Flash
ผลลัพธ์ที่ Google รายงานระบุว่า Gemini 3.5 Flash เป็นหนึ่งในโมเดลระดับ Flash ที่เน้นเอเจนต์ซึ่งแข็งแกร่งที่สุดในปัจจุบัน:
| เบนช์มาร์ก | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
คะแนนเหล่านี้ชี้ให้เห็นถึงความก้าวหน้าครั้งใหญ่ในการดำเนินงานอัตโนมัติ การให้เหตุผลแบบมัลติโหมด และความน่าเชื่อถือด้านวิศวกรรมซอฟต์แวร์ เมื่อเทียบกับรุ่น Gemini Flash ก่อนหน้า
เปรียบเทียบ Gemini 3.5 Flash กับโมเดลอื่น
| ความสามารถ | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| หน้าต่างบริบท | 1M tokens | บริบทขนาดใหญ่ | บริบทขนาดใหญ่ |
| เวิร์กโฟลว์แบบเอเจนต์ | ยอดเยี่ยม | แข็งแกร่ง | แข็งแกร่ง |
| ประสิทธิภาพการเขียนโค้ด | แข็งแกร่งมาก | แข็งแกร่ง | ยอดเยี่ยม |
| ความเร็วในการอนุมาน | เวลาแฝงแบบ Flash ที่ปรับให้เหมาะสม | ช้ากว่า | ปานกลาง |
| อินพุตแบบมัลติโหมด | มัลติโหมดแบบเนทีฟ | มัลติโหมดแบบเนทีฟ | ภาพ + ข้อความ |
| ระบบนิเวศของเครื่องมือ | เครื่องมือจาก Google อย่างครอบคลุม | ครอบคลุม | เครื่องมือ API แข็งแกร่ง |
ความแตกต่างสำคัญ
- เทียบกับ Gemini 3.1 Pro: Gemini 3.5 Flash มอบความสามารถด้านโค้ดและการดำเนินงานอัตโนมัติที่ดีกว่า พร้อมคงความเร็วในการอนุมานที่เร็วกว่ามาก
- เทียบกับ Claude Sonnet 4: Claude มักยังแข็งแกร่งกว่าในเหตุผลระยะยาวที่มีความละเอียดอ่อนและคุณภาพการเขียน ขณะที่ Gemini 3.5 Flash เน้นความเร็ว การดำเนินงานแบบเอเจนต์ และการผสานในระบบนิเวศของ Google
- เทียบกับโมเดลให้เหตุผลตระกูล GPT: Gemini 3.5 Flash โดดเด่นในเวิร์กโฟลว์เอเจนต์แบบมัลติโหมดและการประสานงานบริบทขนาดใหญ่ โดยเฉพาะกรณีใช้งานระบบอัตโนมัติในระดับองค์กร
ข้อจำกัดที่ทราบของ Gemini 3.5 Flash
- ปัจจุบันยังไม่รองรับเอาต์พุตการสร้างภาพหรือเสียงแบบเนทีฟ
- ไม่รองรับ API การสนทนาแบบสดในรุ่นโมเดลนี้
- เบนช์มาร์กจากชุมชนแสดงให้เห็นประสิทธิภาพที่ผสมผสานในงานประเมินเฉพาะทางบางประเภท โดยเฉพาะเวิร์กโฟลว์เฉพาะกลุ่มที่เน้นภาพอย่างมาก
วิธีเข้าถึง Gemini 3.5 Flash API
ขั้นตอนที่ 1: ขอสิทธิ์เข้าถึง API
เข้าสู่ระบบ cometAPI หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้า CometAPI console รับคีย์ API สำหรับสิทธิ์เข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล รับคีย์โทเค็น: sk-xxxxx แล้วส่ง

ขั้นตอนที่ 2: ส่งคำขอไปยัง Gemini 3.5 Flash API
เลือกเอ็นด์พอยต์ “` gemini-3.5-flash” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการเรียกและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ base url คือ Gemini Generating Content
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—ซึ่งเป็นสิ่งที่โมเดลจะตอบกลับ จากนั้นประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ประมวลผลการตอบกลับ
API จะส่งคืนคำตอบตัวเลือกที่มีโครงสร้าง ซึ่งรวมถึงข้อความที่สร้าง อ้างอิง ข้อมูลเมตาความปลอดภัย และผลลัพธ์จากเครื่องมือ (ถ้ามี)