Cách sửa lỗi giới hạn tỷ lệ API của Google Gemini 2.5 Pro

CometAPI
AnnaApr 21, 2025
Cách sửa lỗi giới hạn tỷ lệ API của Google Gemini 2.5 Pro

API Gemini 2.5 Pro của Google cung cấp các khả năng nâng cao cho các nhà phát triển, nhưng việc điều hướng giới hạn tốc độ của nó là rất quan trọng để duy trì hiệu suất ứng dụng liền mạch. Gặp phải lỗi giới hạn tốc độ có thể làm gián đoạn dịch vụ và ảnh hưởng đến trải nghiệm của người dùng. Bài viết này đi sâu vào sự phức tạp của giới hạn tốc độ API Gemini 2.5 Pro và cung cấp các chiến lược để quản lý và giảm thiểu những thách thức này một cách hiệu quả.

Song Tử 2.5 Pro


Giới hạn tỷ lệ API là gì và tại sao chúng lại quan trọng?

Giới hạn tỷ lệ API là những hạn chế do nhà cung cấp dịch vụ đặt ra để kiểm soát số lượng yêu cầu mà khách hàng có thể thực hiện trong một khung thời gian cụ thể. Những giới hạn này đảm bảo việc sử dụng hợp lý, bảo vệ chống lại việc lạm dụng và duy trì hiệu suất hệ thống cho tất cả người dùng. Vượt quá những giới hạn này sẽ dẫn đến lỗi, chẳng hạn như mã trạng thái HTTP 429, cho biết có quá nhiều yêu cầu.


Hiểu về giới hạn tỷ lệ API của Gemini 2.5 Pro

API Gemini áp dụng giới hạn tốc độ trên ba chiều:

  • Yêu cầu mỗi phút (RPM): Giới hạn số lần gọi API mỗi phút.
  • Mã thông báo mỗi phút (TPM): Hạn chế số lượng mã thông báo được xử lý mỗi phút.
  • Yêu cầu mỗi ngày (RPD): Giới hạn tổng số yêu cầu hàng ngày.

Những giới hạn này thay đổi tùy theo gói đăng ký của người dùng:

Bậc miễn phí

MẫuRPMTPMRPD
Gemini 2.5 Pro Thử nghiệm51,000,00025

Tier 1

MẫuRPMTPMRPD
Xem trước Gemini 2.5 Pro1502,000,0001,000

Tier 2

MẫuRPMTPMRPD
Xem trước Gemini 2.5 Pro1,0005,000,00050,000

Tier 3

MẫuRPMTPMRPD
Xem trước Gemini 2.5 Pro2,0008,000,000-

Điều quan trọng cần lưu ý là các giới hạn này được áp dụng cho mỗi dự án, không phải cho mỗi khóa API citeturn0search0.


Chiến lược quản lý và giảm thiểu giới hạn tỷ lệ

1. Theo dõi việc sử dụng và hiểu rõ giới hạn

Thường xuyên theo dõi việc sử dụng API của bạn thông qua Google Cloud Console để đảm bảo bạn nằm trong giới hạn được phân bổ. Hiểu được các mẫu sử dụng hiện tại của bạn có thể giúp điều chỉnh tỷ lệ yêu cầu của ứng dụng cho phù hợp.

2. Thực hiện thời gian chờ theo cấp số nhân

Kết hợp các chiến lược lùi theo cấp số nhân vào ứng dụng của bạn để xử lý lỗi giới hạn tốc độ một cách nhẹ nhàng. Điều này bao gồm việc thử lại các yêu cầu không thành công sau các khoảng thời gian dài hơn, giảm khả năng xảy ra lỗi lặp lại.

3. Tối ưu hóa hiệu quả yêu cầu

Xem xét và tối ưu hóa các yêu cầu API của ứng dụng để giảm thiểu các cuộc gọi không cần thiết. Việc xử lý hàng loạt các yêu cầu hoặc lưu trữ phản hồi khi cần thiết có thể giảm đáng kể số lượng các cuộc gọi API.

4. Nâng cấp gói đăng ký của bạn

Nếu nhu cầu của ứng dụng vượt quá giới hạn tốc độ hiện tại, hãy cân nhắc nâng cấp lên gói đăng ký cao hơn. Gói cao hơn cung cấp giới hạn cao hơn, đáp ứng nhu cầu sử dụng rộng rãi hơn.

5. Yêu cầu tăng hạn ngạch

Nếu không thể nâng cấp, bạn có thể yêu cầu tăng hạn ngạch thông qua Google Cloud Console. Điều hướng đến trang hạn ngạch, chọn hạn ngạch có liên quan và gửi yêu cầu tăng.


Điều gì xảy ra nếu tôi vượt quá giới hạn miễn phí?

Nếu bạn vượt quá giới hạn sử dụng miễn phí của Google Gemini 2.5 Pro API, ứng dụng của bạn sẽ nhận được 429 TÀI NGUYÊN_ĐÃ_HẾT lỗi, cho biết bạn đã vượt quá số lượng yêu cầu hoặc mã thông báo được phép trong một khoảng thời gian nhất định. Lỗi này ngăn chặn các cuộc gọi API tiếp theo cho đến khi mức sử dụng của bạn trở lại trong giới hạn được phép.

Giới hạn cấp miễn phí:

Đối với mẫu Gemini 2.5 Pro Experimental, gói miễn phí áp dụng các hạn chế sau:

  • Yêu cầu mỗi phút (RPM): 5
  • Mã thông báo mỗi phút (TPM): 1,000,000
  • Yêu cầu mỗi ngày (RPD): 25

Những giới hạn này được áp dụng cho mỗi dự án, không phải cho mỗi khóa API.

Giới hạn tốc độ động:

Một số người dùng đã báo cáo gặp phải giới hạn tốc độ ngay cả khi mức sử dụng của họ dường như nằm trong ngưỡng được ghi lại. Điều này cho thấy Google có thể triển khai giới hạn tốc độ động dựa trên các yếu tố như tải máy chủ hoặc thời gian trong ngày.

Kết luận

Quản lý hiệu quả giới hạn tỷ lệ API là rất quan trọng để duy trì hiệu suất và độ tin cậy của các ứng dụng sử dụng Google Gemini 2.5 Pro API. Bằng cách hiểu các hạn chế, theo dõi việc sử dụng và triển khai các tối ưu hóa chiến lược, các nhà phát triển có thể giảm thiểu tác động của giới hạn tỷ lệ và đảm bảo trải nghiệm người dùng liền mạch.

Sử dụng API Gemini 2.5 trong CometAPI

CometAPI cung cấp quyền truy cập vào hơn 500 mô hình AI, bao gồm các mô hình đa phương thức chuyên biệt và mã nguồn mở cho trò chuyện, hình ảnh, mã, v.v. Điểm mạnh chính của nó nằm ở việc đơn giản hóa quy trình tích hợp AI phức tạp theo truyền thống. Với nó, quyền truy cập vào các công cụ AI hàng đầu như Claude, OpenAI, Deepseek và Gemini có sẵn thông qua một đăng ký thống nhất duy nhất. Bạn có thể sử dụng API trong CometAPI để tạo nhạc và tác phẩm nghệ thuật, tạo video và xây dựng quy trình làm việc của riêng bạn

Sao chổiAPI cung cấp mức giá giảm 20% so với giá chính thức giá chính thức để giúp bạn tích hợp API Gemini 2.5 ProGemini 2.5 Flash Pre APIvà bạn sẽ nhận được 1 đô la vào tài khoản sau khi đăng ký và đăng nhập!

Thông tin mô hình trong Comet API vui lòng xem Tài liệu API.

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%