API Gemini 2.5 Pro แบบฟรีเสียหรือ? การเปลี่ยนแปลงโควต้าฟรีในปี 2025

CometAPI
AnnaDec 11, 2025
API Gemini 2.5 Pro แบบฟรีเสียหรือ? การเปลี่ยนแปลงโควต้าฟรีในปี 2025

Google ได้ปรับเข้มชั้นฟรีของ Gemini API อย่างมาก: Gemini 2.5 Pro ถูกถอดออกจากชั้นฟรี และคำขอฟรีรายวันของ Gemini 2.5 Flash ถูกลดลงอย่างรุนแรง (รายงาน: ~250 → ~20/วัน) นั่นไม่ได้หมายความว่าโมเดลจะ “ตาย” ถาวรสำหรับการทดลองใช้งาน — แต่หมายความว่าการเข้าถึงฟรีแทบถูกตัดจนใช้ไม่ได้สำหรับหลายกรณีการใช้งานจริง

มีการเปลี่ยนแปลงอะไรใน Gemini API — และทำไมถึงสำคัญ?

นักพัฒนาพบอะไรบ้าง

ในสัปดาห์แรกของเดือนธันวาคม 2025 นักพัฒนาจำนวนมากพบข้อผิดพลาด 429 (ข้อผิดพลาดการจำกัดอัตรา) โดยฉับพลันและโมเดลหายไปจากแดชบอร์ด AI Studio / API สาเหตุมาจาก:

  • gemini-2.5-pro ไม่แสดงอยู่ภายใต้ขีดจำกัดการใช้งานชั้นฟรีสำหรับหลายบัญชี (เท่ากับ 0 คำขอฟรี/วัน สำหรับ Pro)
  • gemini-2.5-flash (ชั้น flash ที่หน่วงต่ำกว่า) มีรายงานว่าจำนวนคำขอฟรีรายวันถูกลดจากประมาณ 250 คำขอ/วัน ลงเหลือราว 20 คำขอ/วัน สำหรับหลายบัญชีฟรี นั่นเป็นการลดลงในระดับ ~90%+

การเปลี่ยนแปลงเหล่านี้ถูกสังเกตเมื่อโปรเจกต์ส่วนตัวและโฟลว์อัตโนมัติเริ่มล้มเหลวด้วยข้อผิดพลาดการจำกัดอัตรา การผสมกันของการลดจำนวนการเรียกต่อวันและการมีรอบ Pro ฟรีน้อยลง ทำให้ต้นทุนของการทดลองและระบบอัตโนมัติขนาดเล็กที่พึ่งพาชั้นฟรีเพิ่มขึ้นอย่างมาก

ทำไมถึงสำคัญ:

  • นักพัฒนารายย่อย ผู้ใช้สายงานอดิเรก และสตาร์ทอัพระยะเริ่มต้นที่สร้างต้นแบบบนชั้นฟรีต้องเผชิญเวิร์กโฟลว์ที่เสียหายหรือถูกลดจาก Pro ไปเป็น Flash อย่างรวดเร็วกลางเซสชัน
  • เครื่องมือและระบบอัตโนมัติที่ต้องพึ่งพาการเรียกเล็ก ๆ หลายสิบหรือหลายร้อยครั้งต่อวัน (การตรวจ CI แชตบอท ระบบอัตโนมัติในบ้าน สายพานเนื้อหา) ได้รับผลกระทบมากเป็นพิเศษ
  • การเปลี่ยนแปลงนี้สะท้อนยุทธศาสตร์ที่กว้างขึ้นของ Google: ให้ความสำคัญกับผู้ใช้แบบชำระเงินภายใต้โหลดหนัก และผลักดันการใช้งานปริมาณสูงไปที่ชั้นแบบชำระเงินหรือข้อตกลงระดับองค์กร หน้าเผยแพร่ราคาและขีดจำกัดอย่างเป็นทางการยังมีโครงสร้างไม่เปลี่ยน (ราคาต่อโทเค็นยังคงเผยแพร่) แต่หลักฐานอิสระและกระทู้สนทนาของ Google แสดงการบังคับใช้ที่เปลี่ยนไปในชั้นโควตา

โควตาและต้นทุนปัจจุบันคืออะไร? ทำไมถึงเปลี่ยน?

เดิมที Gemini 2.5 Pro (ฟรี) เปิดให้ใช้เป็นพรีวิวทดลองสำหรับนักพัฒนาจำนวนมาก อย่างไรก็ตามในช่วงต้นเดือนธันวาคม โควตาฟรีสำหรับ Gemini 2.5 Pro ถูกยกเลิกโดยไม่คาดคิด และจำนวนคำขอของ 2.5 Flash ก็ถูกลดลงอย่างมาก นักพัฒนาหลายคนรู้สึกว่าไม่ให้เกียรติและทำให้ผู้ใช้เกิดความเสียหายบางส่วน

API Gemini 2.5 Pro แบบฟรีเสียหรือ? การเปลี่ยนแปลงโควต้าฟรีในปี 2025

การเปรียบเทียบง่าย ๆ — โควตาฟรีก่อนหน้าเทียบกับที่รายงานในปัจจุบัน

Modelโควตาฟรีที่เคยรายงาน (พบทั่วไป กลางปี 2025 → พ.ย. 2025)โควตาฟรีที่รายงานปัจจุบัน (พบช่วงต้น ธ.ค. 2025)
gemini-2.5-pro50–100 คำขอ/วัน (ช่วงพรีวิว; ทดลอง) RPM: ~2–5 ; RPD: 25–100มักไม่แสดง / ถูกถอดจากชั้นฟรี (ไม่ปรากฏภายใต้โควตาที่ไม่ชำระเงิน)
gemini-2.5-flashRPM: 10 ; RPD: 250RPD: ~20 สำหรับหลายบัญชีฟรี (ลดลงจาก 250→20)
gemini-2.5-flash-liteRPM: 15 ; RPD: 1000 (ค่าที่เคยเผยแพร่ก่อนหน้า)ไม่มีการเปลี่ยนแปลงในวงกว้าง

ปัจจุบัน นักพัฒนาที่ต้องการใช้ Gemini 2.5 Pro และชั้นที่สูงขึ้นของ Gemini 2.5 flash สามารถสมัครแพ็กเกจ Pro หรือ Ultra และใช้ Gemini 2.5 ตามราคา API ที่ Gemini กำหนด:

Modelราคาชำระสำหรับอินพุต (ต่อ 1M โทเค็น)ราคาชำระสำหรับเอาต์พุต (ต่อ 1M โทเค็น)หมายเหตุ
gemini-2.5-pro (Standard)1.25 (\<\=200k prompts) / 2.50 (>200k)10.00 (\<\=200k) / 15.00 (>200k)Pro มุ่งเน้นการเขียนโค้ดและการให้เหตุผลเชิงซับซ้อน
gemini-2.5-flash (Standard)$0.30 (text/image/video)$2.50 (output incl. thinking tokens)สมดุลราคาต่อประสิทธิภาพดีที่สุด; หน้าต่างบริบท 1M โทเค็น
gemini-2.5-flash-lite$0.10 (text/image/video)$0.40โมเดลคุ้มค่า รองรับปริมาณสูง เหมาะกับการสเกล

ข่าวดีคือ CometAPI มี Gemini API ที่ราคาถูกกว่า ข่าวดีคือ CometAPI มี Gemini API ราคาถูกกว่าและมักมีโปรวันหยุด เช่น Black Friday และส่วนลดคริสต์มาสล่าสุด

ทำไมลดลง (เหตุผลตามที่ Google ระบุ)

คำตอบจากเจ้าหน้าที่ Google ในฟอรัมนักพัฒนาอย่างเป็นทางการยืนยันว่าขีดจำกัดฟรีของ 2.5 Pro ถูกปรับลดลงเนื่องจากมีการจัดสรรขีดความสามารถไปยังโมเดลใหม่ที่มีความต้องการสูง การเคลื่อนไหวนี้ขับเคลื่อนโดยการบริหารจัดการขีดความสามารถและความต้องการ: การเปิดตัวใหม่ (Gemini 3 และรุ่น Pro/Ultra) ใช้ทรัพยากรคอมพิวต์มากเกินสัดส่วน จึงจำกัดว่าโมเดลใดบ้างจะอยู่ในชั้นฟรีชั่วคราวเพื่อความเสถียรและให้ความสำคัญกับชั้นแบบชำระเงินและการเปิดตัวใหม่

API Gemini 2.5 Pro แบบฟรีเสียหรือ? การเปลี่ยนแปลงโควต้าฟรีในปี 2025

Google จะคืนการเข้าถึง Pro ฟรีได้หรือไม่? — สถานการณ์ที่เป็นไปได้

ต่อไปนี้เป็นสถานการณ์ที่สมจริงและเงื่อนไข/ความน่าจะเป็นสำหรับแต่ละกรณี (หมายเหตุ: เป็นการวิเคราะห์เชิงอนุมาน ไม่ใช่แถลงการณ์นโยบายของ Google)

1) ย้อนมาตรการชั่วคราวและกำหนดสิทธิ์ฟรีระหว่างกาลที่ชัดเจนขึ้น (เป็นไปได้แต่มีเงื่อนไข)

หากปัญหาขีดความสามารถ/การใช้งานผิดปกติถูกแก้ไขได้ — เช่น จำกัดอัตราต่อบัญชีอย่างแม่นยำมากขึ้น ลดพฤติกรรมการใช้งานที่ผิดปกติ หรือเพิ่มคอมพิวต์ระยะสั้น — Google อาจคืนชั้นเข้าถึงฟรีแบบจำกัดบางส่วนพร้อมเพดานและรั้วกั้นที่ชัดเจน มีความเป็นไปได้ปานกลางหากกระแสคัดค้านจากชุมชนสูงและเทเลเมทรีแสดงว่าผู้ใช้ฟรีส่วนใหญ่เป็นการใช้งานที่ถูกต้อง การคืนสิทธิ์จะน่าจะจำกัดแคบลง (จำนวนการเรียกต่อวันน้อยลง ไม่มี SLA ระดับ Pro) หลักฐาน: ระบบจำกัดอัตราสาธารณะและคำแถลงว่า Google สามารถปรับแต่งขีดจำกัดได้

2) Pro ฟรีไม่กลับมาในวงกว้าง; ยังคงมีประตูแบบชำระเงิน (มีแนวโน้ม)

เนื่องจาก Google แสดงเจตนาราคาอย่างเปิดเผยและเพราะโมเดล Pro มีต้นทุนสูง ผลลัพธ์ที่เป็นไปได้มากคือ Pro ยังคงเป็นฟีเจอร์แบบชำระเงินสำหรับผู้ใช้ส่วนใหญ่ โดยมีเพียงพรีวิว/โปรโมชันระยะสั้น การที่ระบุว่า “Pro ฟรีมีไว้แค่สุดสัปดาห์เดียว” สนับสนุนความเป็นไปได้นี้ นี่เป็นแนวโน้มระยะยาวที่น่าจะเกิดขึ้น เว้นแต่ Google จะทบทวนแนวทางการทำเงินใหม่

3) การเข้าถึงฟรีแบบมุ่งเป้าสำหรับกลุ่มเฉพาะ (วิชาการ โอเพนซอร์ส องค์กรไม่แสวงกำไร) (เป็นไปได้)

ผู้ให้บริการคลาวด์จำนวนมากมีโครงการมุ่งเป้า: ทุน เครดิต โปรแกรมสำหรับสถาบัน Google อาจปรับไปให้สิทธิ์เข้าถึงระดับ Pro ฟรีหรือมีส่วนลดแก่ผู้วิจัย ครู และผู้ดูแลโอเพนซอร์สที่ยืนยันตัวตน ขณะคงการเข้าถึงทั่วไปไว้หลังชั้นแบบชำระเงิน วิธีนี้ช่วยแก้กังวลด้านภาพลักษณ์และทำให้โมเดลขั้นสูงเข้าถึงได้เพื่อการวิจัย

แล้ว Gemini 2.5 จะกลับมาฟรีอีกไหม?

คำตอบสั้น ๆ: ไม่กว้างขวาง และไม่เหมือนแบบไม่จำกัดดังเดิม รูปแบบในอดีต (พรีวิว → ชั้นแบบชำระเงิน) และคำแถลงผลิตภัณฑ์ของ Google ทำให้โอกาสที่จะมีชั้น Pro ฟรีที่ใจกว้างถาวรนั้นต่ำ อย่างไรก็ตาม การเข้าถึงฟรีแบบบางส่วน แบบมุ่งเป้า หรือช่วงเวลาจำกัดอาจกลับมาโดยมีรั้วกั้นที่เข้มขึ้น (เพดานรายวันต่ำลง รูปแบบเชิญเข้าร่วม เครดิตภาควิชาการ) การกลับมาของ Pro ฟรีในรูปแบบที่ใช้งานได้อย่างกว้างขวางน่าจะต้องอาศัยการเปลี่ยนแปลงมากในระบบควบคุมต้นทุน/การใช้งานผิดปกติของ Google หรือโมเดลการค้าแบบอื่น

ฉันจะใช้งาน Gemini 2.5 ต่อไปวันนี้ได้อย่างไร (ทางเลือกและวิธีเลี่ยงปัญหา)?

หากโปรเจกต์ของคุณพึ่งพา 2.5 Pro ฟรีหรือโควตา Flash ฟรีที่สูงกว่า ต่อไปนี้คือทางเลือกเชิงปฏิบัติ:

1) ใช้ Gemini 2.5 Flash หรือ Flash-Lite (หากตรงกับการใช้งานของคุณ)

Flash และ Flash-Lite มีต้นทุนแบบชำระเงินที่ต่ำกว่าอย่างมาก และยังเป็นโมเดลที่แนะนำสำหรับปริมาณสูง Flash ยังคงปรากฏในตารางโทเค็นของชั้นฟรี (แม้ว่า RPD จะถูกลดลง) หากคุณอยู่ได้ด้วยคำขอไม่กี่ครั้งต่อวัน หรือรวมพรอมป์หลาย ๆ อันให้เป็นการเรียกที่น้อยลง ก็สามารถลดต้นทุนได้

2) เปลี่ยนไปใช้แบบชำระเงิน (โทเค็นที่เรียกเก็บเงินโดย Google)

หากคุณต้องการความเชื่อถือระดับผลิต การเปลี่ยนไปใช้โมเดลโทเค็นแบบชำระเงินจะยกเลิกเพดาน RPD เล็ก ๆ และให้ขีดจำกัดอัตราที่สูงกว่า (และอาจมีลำดับความสำคัญสูงกว่า) ประเมินจำนวนโทเค็นต่อการเรียกเพื่อคาดการณ์ค่าใช้จ่ายรายเดือน (ใช้ราคาต่อโทเค็นตามตารางด้านบน)

3) ใช้เกตเวย์บุคคลที่สามอย่าง CometAPI (คืออะไรและข้อดี)

ผู้รวบรวมบุคคลที่สาม เช่น CometAPI มี API เดียวแบบรวมที่เปิดเผยหลายโมเดล (OpenAI, Anthropic, Google Gemini, รุ่นต่าง ๆ, suno) ผ่านจุดปลายทางเดียว CometAPI ช่วยให้ง่ายต่อการเชื่อมต่อ บิลลิงแบบรวม ราคาแยกต่อโมเดล (ลด ~20% จากราคาทางการ) มี SDK และการจัดการคีย์แบบรวม นอกจากนี้ยังมีทดลองใช้ฟรีและเครดิตโทเค็นสำหรับผู้ใช้ใหม่

ข้อดีของ CometAPI (โดยทั่วไป):

  • Unified endpoint & SDKs — อินทิเกรชันเดียวสำหรับหลายผู้ให้บริการ
  • การเรียกเก็บเงินที่ง่ายกว่า — บิลเดียวและโควต้าเดียวให้จัดการ เทียบกับการมีบัญชีผู้ให้บริการแยกกันหลายเจ้า
  • อัตราค่าบริการโมเดลที่ลดในบางครั้ง — ผู้จำหน่ายอาจเสนอการเข้าถึงโมเดลในราคาที่แตกต่างเล็กน้อย หน้า CometAPI แสดงราคาของโมเดลที่ตนเองกำหนด (เช่น โฆษณาว่า “ราคาทางการลบประมาณ ~20%” สำหรับบางโมเดล) ตรวจสอบหน้าเว็บไซต์สำหรับข้อเสนอปัจจุบัน
  • เครื่องมือเป็นมิตรกับนักพัฒนา — playgrounds โค้ดตัวอย่าง การทดสอบหลายโมเดล

เทคนิคประหยัดต้นทุนที่ควรนำไปใช้

  • แคชผลลัพธ์ สำหรับพรอมป์เหมือนกันและบริบทล่าสุด
  • รวมคำขอเป็นชุด (รวมพรอมป์เล็ก ๆ หลายอันเป็นการเรียกเดียว)
  • ใช้โมเดลที่เล็กลง/เฉพาะทาง สำหรับการเรียกบ่อย ๆ ที่ความซับซ้อนไม่สูง (ฝัง + สืบค้น + โมเดลเล็กสำหรับการสร้าง)
  • ควอนไทซ์ / บีบอัด โมเดลหากโฮสต์เอง (ควอนไทซ์ 4/8-bit) เพื่อลดหน่วยความจำ GPU และต้นทุน
  • ติดตามและตั้งเพดานแข็ง เพื่อหลีกเลี่ยงการใช้จ่ายเกินเมื่อสลับผู้ให้บริการ
    เทคนิคเหล่านี้ช่วยลดต้นทุนโทเค็น/GPU ได้มากและยืดอายุโควตา

บทสรุปสุดท้าย: Gemini 2.5 Pro ฟรี “พัง” แล้วหรือยัง?

“พัง” อาจฟังดูแรง — แต่ถูกต้องในทางปฏิบัติสำหรับหลายทีม การเปลี่ยนแปลงโควตาและราคาอย่างเป็นทางการของ Google แสดงการปรับเข้มอย่างตั้งใจ: การเข้าถึง Pro ฟรีถูกจำกัดอย่างมากในหลายบัญชีและโควตา Flash ฟรีถูกตัดลงอย่างรุนแรงในกรณีที่มีรายงาน นั่นทำให้การพึ่งพาพฤติกรรมฟรีเดิมมีความเสี่ยงสำหรับงานผลิตหรือการพัฒนาอย่างต่อเนื่อง

อย่างไรก็ตาม คุณยังมีตัวเลือก:

  • เปลี่ยนไปใช้ชั้นแบบชำระเงินหากต้องการความสามารถระดับ Pro ที่สม่ำเสมอและการคุ้มครองข้อมูลระดับองค์กร
  • ใช้การเลือกโมเดล การแคช การรวมคำขอ และบริการเกตเวย์อย่าง CometAPI เพื่อลดต้นทุนต่อหน่วยอย่างมากพร้อมคงคุณภาพผลลัพธ์ระดับ Gemini

เพื่อเริ่มต้น สำรวจความสามารถของรุ่น Gemini 2.5 (Gemini 2.5 Flash Image API , Gemini 2.5 pro, gemini 2.5 flash) ใน Playground และดู คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนเข้าใช้งาน โปรดตรวจสอบว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับ API key แล้ว CometAPI เสนอราคาที่ต่ำกว่าราคาทางการมากเพื่อช่วยให้คุณผสานรวมได้

พร้อมเริ่มไหม?→ ทดลองใช้ฟรีรุ่น gemini !

SHARE THIS BLOG

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%