Come risolvere i limiti di velocità dell'API di Google Gemini 2.5 Pro

CometAPI
AnnaApr 21, 2025
Come risolvere i limiti di velocità dell'API di Google Gemini 2.5 Pro

L'API Gemini 2.5 Pro di Google offre funzionalità avanzate per gli sviluppatori, ma gestire i suoi limiti di velocità è fondamentale per mantenere prestazioni ottimali delle applicazioni. Errori nei limiti di velocità possono interrompere i servizi e influire sull'esperienza utente. Questo articolo approfondisce le complessità dei limiti di velocità dell'API Gemini 2.5 Pro e fornisce strategie per gestire e mitigare efficacemente queste sfide.

Gemelli 2.5 Pro


Cosa sono i limiti di velocità API e perché sono importanti?

I limiti di velocità delle API sono restrizioni imposte dai provider di servizi per controllare il numero di richieste che un client può effettuare entro un intervallo di tempo specifico. Questi limiti garantiscono un utilizzo corretto, proteggono dagli abusi e mantengono le prestazioni del sistema per tutti gli utenti. Il superamento di questi limiti genera errori, come il codice di stato HTTP 429, che indica un numero eccessivo di richieste.


Informazioni sui limiti di velocità dell'API Gemini 2.5 Pro

L'API Gemini impone limiti di velocità su tre dimensioni:

  • Richieste al minuto (RPM): Limita il numero di chiamate API al minuto.
  • Token al minuto (TPM): Limita il numero di token elaborati al minuto.
  • Richieste al giorno (RPD): Limita il numero totale di richieste giornaliere.

Questi limiti variano in base al livello di abbonamento dell'utente:

Piano gratuito

ModelloRPMTPMRPD
Gemini 2.5 Pro Sperimentale51,000,00025

Tier 1

ModelloRPMTPMRPD
Anteprima di Gemini 2.5 Pro1502,000,0001,000

Tier 2

ModelloRPMTPMRPD
Anteprima di Gemini 2.5 Pro1,0005,000,00050,000

Tier 3

ModelloRPMTPMRPD
Anteprima di Gemini 2.5 Pro2,0008,000,000-

È importante notare che questi limiti vengono applicati per progetto, non per chiave API citeturn0search0.


Strategie per gestire e mitigare i limiti di velocità

1. Monitorare l'utilizzo e comprendere i limiti

Monitora regolarmente l'utilizzo delle API tramite Google Cloud Console per assicurarti di rientrare nei limiti assegnati. Comprendere i tuoi attuali modelli di utilizzo può aiutarti ad adattare di conseguenza la frequenza delle richieste della tua applicazione.

2. Implementare il backoff esponenziale

Integra strategie di backoff esponenziale nella tua applicazione per gestire in modo efficiente gli errori di rate limit. Questo comporta il ritentamento delle richieste non riuscite dopo intervalli progressivamente più lunghi, riducendo la probabilità di errori ripetuti.

3. Ottimizzare l'efficienza delle richieste

Esamina e ottimizza le richieste API della tua applicazione per ridurre al minimo le chiamate non necessarie. L'elaborazione in batch delle richieste o la memorizzazione nella cache delle risposte, ove opportuno, può ridurre significativamente il numero di chiamate API.

4. Aggiorna il tuo livello di abbonamento

Se le esigenze della tua applicazione superano i limiti di tariffazione attuali, valuta la possibilità di passare a un livello di abbonamento superiore. I livelli superiori offrono limiti più elevati, consentendo un utilizzo più intensivo.

5. Richiedi un aumento della quota

Se l'aggiornamento non è fattibile, puoi richiedere un aumento della quota tramite Google Cloud Console. Accedi alla pagina delle quote, seleziona la quota desiderata e invia una richiesta di aumento.


Cosa succede se supero i limiti gratuiti?

Se superi i limiti di utilizzo gratuito dell'API Google Gemini 2.5 Pro, la tua applicazione riceverà un 429 RISORSE ESAURITE Errore che indica che hai superato il numero consentito di richieste o token in un determinato intervallo di tempo. Questo errore impedisce ulteriori chiamate API finché l'utilizzo non rientra nei limiti consentiti.

Limiti del livello gratuito:

Per il modello sperimentale Gemini 2.5 Pro, il livello gratuito impone le seguenti restrizioni:

  • Richieste al minuto (RPM): 5
  • Token al minuto (TPM): 1,000,000
  • Richieste al giorno (RPD): 25

Questi limiti vengono applicati per progetto, non per chiave API.

Limitazione dinamica della velocità:

Alcuni utenti hanno segnalato di aver riscontrato limiti di velocità anche quando il loro utilizzo sembra rientrare nelle soglie documentate. Ciò suggerisce che Google potrebbe implementare limiti di velocità dinamici basati su fattori come il carico del server o l'ora del giorno.

Conclusione

Gestire efficacemente i limiti di velocità delle API è fondamentale per mantenere le prestazioni e l'affidabilità delle applicazioni che utilizzano l'API Google Gemini 2.5 Pro. Comprendendo i limiti, monitorando l'utilizzo e implementando ottimizzazioni strategiche, gli sviluppatori possono mitigare l'impatto dei limiti di velocità e garantire un'esperienza utente fluida.

Utilizza l'API Gemini 2.5 in CometAPI

CometAPI offre accesso a oltre 500 modelli di intelligenza artificiale, inclusi modelli multimodali open source e specializzati per chat, immagini, codice e altro ancora. Il suo punto di forza principale risiede nella semplificazione del processo di integrazione dell'intelligenza artificiale, tradizionalmente complesso. Grazie a CometAPI, l'accesso ai principali strumenti di intelligenza artificiale come Claude, OpenAI, Deepseek e Gemini è disponibile tramite un unico abbonamento unificato. È possibile utilizzare l'API di CometAPI per creare musica e grafica, generare video e creare flussi di lavoro personalizzati.

CometaAPI offrire un prezzo del 20% in meno rispetto al prezzo ufficiale per aiutarti a integrare API di Gemini 2.5 Pro e al Pre-API Flash Gemini 2.5e riceverai 1$ sul tuo account dopo esserti registrato e aver effettuato l'accesso!

Per informazioni sul modello in Comet API, vedere Documento API.

Leggi di più

500+ Modelli in Una API

Fino al 20% di sconto