¿Es Gemini 2.5 Pro gratis? Una guía completa

El ciclo de lanzamiento de Google, de marzo a abril de 2025, presentó la primera versión preliminar pública de Gemini 2.5 Pro, un modelo multimodal "pensante" que incluye una ventana de contexto de un millón de tokens y las puntuaciones de razonamiento más altas de cualquier modelo de Google hasta la fecha. La compañía mantuvo una cuota gratuita para Gemini 2.5 Pro, pero la trasladó a un punto final experimental.gemini‑2.5‑pro‑exp‑03‑25) al activar la facturación para la vista previa de producción (gemini‑2.5‑pro‑preview‑03‑25). Por lo tanto, los desarrolladores obtienen acceso gratuito para explorar Gemini 2.5 Pro, además de una ruta de actualización clara cuando necesitan límites de velocidad más altos o garantías de SLA. Mientras tanto, Google Cloud Next 2025 amplió las integraciones de Gemini con Vertex AI, el nuevo TPU v7 "Ironwood" y la pila Agent Engine, lo que indica que Gemini 2.5 Pro es la pieza central de la visión de computación agéntica de Google, especialmente para quienes buscan herramientas potentes en el panorama de la IA.

¿Qué hace que Gemini 2.5 Pro sea diferente de los modelos Gemini anteriores?

1. ¿Cómo funciona realmente el mecanismo del “pensamiento”?

El ejecutor interno de cadena de pensamiento de Gemini ejecuta pasos de planificación latentes antes de emitir una respuesta final, de forma similar a la canalización AlphaCode 2 de DeepMind. Google lo denomina "modo de pensamiento" y en la versión 2.5 Pro siempre está activo, mientras que en la versión 1.5 Pro debía activarse manualmente añadiendo el parámetro thinking=true. El resultado es un mejor rendimiento en la generación de código, demostraciones matemáticas avanzadas y tareas de razonamiento de varios pasos.

En esencia, Gemini 2.5 Pro representa un avance significativo en las capacidades de IA, lo que lo convierte en una herramienta valiosa tanto para desarrolladores como para investigadores.

Con Gemini 2.5, los usuarios pueden desbloquear funciones y capacidades innovadoras que mejoran aún más la experiencia de IA.

2. ¿Por qué la ventana de contexto de un millón de tokens supone un cambio radical?

Una ventana de un millón de tokens (aproximadamente 750 MB de texto) permite alimentar repositorios de código completos, PDF de varios capítulos o horas de vídeo transcrito en una sola solicitud. Esto equivale a 10 veces el contexto estándar de 4 k de GPT‑128o y aproximadamente a Claude 3‑200k de Anthropic, pero sin coste en el nivel experimental.

3. ¿Gemini 2.5 Pro incluye funciones de visión y audio?

Sí. Al igual que la versión 1.5 Pro, es multimodal de forma nativa: el mismo punto final ingiere texto, imágenes o fragmentos cortos de audio sin cambiar de modelo. La diferencia radica en la comprensión de vídeos de larga duración (hasta 10 minutos, frente a los 90 segundos de la versión 1.5 Pro) y la incorporación de imágenes de mayor resolución.

¿Cuánto de Gemini 2.5 Pro es realmente gratuito en 2025?

"¿Qué me ofrece la versión gratuita experimental?"

Métrico	Experimento gratuito (`gemini‑2.5‑pro‑exp‑03‑25`)	Vista previa del nivel de pago
Solicitudes por minuto	25 RPM	180 RPM (tapa blanda)
Tokens entrantes y salientes por minuto	250k	2 millones
Límite de solicitud diaria	500RPD	5 000 rupias
SLA	Máximo esfuerzo	99.9%
Precio	$0	$0.005 / 1 k tokens de entrada + $0.015 / 1 k tokens de salida

Llevar: Para prototipos, herramientas personales o proyectos de aula, el punto final experimental es prácticamente ilimitado. Para cargas de trabajo de producción, el SKU de vista previa sigue siendo más económico que GPT‑4o con la misma longitud de contexto.

Explora formas de acceder gratis a Gemini 2.5 Exp

1. Vista previa gratuita integrada de AI Studio

¿Qué es?

Google ha configurado Gemini 2.5 Pro y 2.5 Flash para Precios de $ 0 En marzo de 2025, AI Studio lo denominó "versión preliminar gratuita". Cada nueva clave API hereda la cuota.

Cómo activar

Visite https://aistudio.google.com/apikey.
Haga clic en Crear clave API → Gemini 2.5 Pro.
Pegue la clave de 40 caracteres en su aplicación (export GEMINI_API_KEY=...).

Límites que aún se aplican

Ráfaga de 60 solicitudes por minuto, 3 por hora sostenidas.
300 k tokens por día UTC (indicación + finalización).
Si excede alguno de ellos, obtendrá HTTP 429 hasta que se reinicie la ventana.

2. Educación y promoción de startups

Nivel “ilimitado” para estudiantes/profesores

Google permite a cualquier persona con un correo electrónico institucional (.edu, .ac, .edu.tr, etc.) o un dominio válido ISIC La tarjeta actualiza su clave de AI Studio. La etiqueta del panel cambia a Nivel de estudiante: tokens ilimitados y la fecha de finalización dice 30 de junio de 2026.

pasos

En la misma página de clave API, seleccione Verificar con identificación de estudiante.
Sube tu tarjeta o haz clic en el botón campus‑SSO.
La aprobación es instantánea para la mayoría de los dominios de EE. UU. y la UE; la revisión manual puede demorar 24 horas en otros lugares.

Aviso: Google envía por correo electrónico un enlace de reverificación. 31 de agosto de 2025Si lo pierdes, volverás a la cuota pública.

Fondo de IA de Google para startups

Las empresas en etapa inicial aceptadas en el programa reciben un cupón que desbloquea por proyecto llamadas ilimitadas en Vértice AI por 12 meses.

Crear un proyecto en la nube → Vertex AI → Modelos generativos → Habilitar cupón.
La asignación gratuita aumenta con cada proyecto adicional, por lo que los microservicios pueden vivir en proyectos separados sin cargo.

3. Pasarelas de terceros y complementos IDE

enrutador abierto

OpenRouter expone el modelo público de Google "gemini-2.5-pro-exp-03-25:free" mediante su propio sistema de claves. Si se agota la cuota de AI Studio, cambia los endpoints, pero continúa programando sin interrupciones.

bashcurl https://openrouter.ai/api/v1 \
  -H "Authorization: Bearer $OPENROUTER_KEY" \
  -d '{
        "model":"google/gemini-2.5-pro-exp-03-25:free",
        "messages":
      }'

Roo Code y Cline (extensiones de VS Code)

Ambas herramientas IDE configuran automáticamente OpenRouter para usted: pegue su propia clave de AI Studio or una clave OpenRouter y seleccione la gratuitamente Variante de Géminis de un menú desplegable.

Atajo de cursor IDE

Cursor incluye un perfil “Gemini 2.5 Free” listo para usar; al alternarlo, se enruta el tráfico a través de Google o OpenRouter según cuál aún tenga cuota.

Advertencias

Las solicitudes se envían mediante proxy, por lo que acepta los términos de privacidad de OpenRouter o del IDE.
El rendimiento se limita a ~30 solicitudes/min para evitar el abuso.
Si Google alguna vez elimina el punto final público gratuito, estos servicios dejarán de funcionar.

CometAPI

CometAPI proporciona acceso a más de 500 modelos de IA, incluyendo modelos multimodales especializados y de código abierto para chat, imágenes, código y más. Su principal ventaja radica en simplificar el proceso, tradicionalmente complejo, de integración de IA. Acceso API de Gemini 2.5 Pro a través de la clave CometAPI

CometAPI Ofrecemos un precio mucho más bajo que el precio oficial para ayudarte a integrarte API de Gemini 2.5 Pro¡Recibirás $1 en tu cuenta después de registrarte e iniciar sesión! Bienvenido a registrarte y a experimentar CometAPI. CometAPI paga por uso.API de Gemini 2.5 Pro (nombre del modelo: gemini-2.5-pro-preview-03-25; gemini-2.5-pro-exp-03-25) en CometAPI Los precios se estructuran de la siguiente manera:

Tokens de entrada: $2/M tokens
Tokens de salida: $8 / M tokens

Para una integración rápida, consulte Documento API

Prueba gratuita: regístrate y obtén una prueba de $1

Requisitos previos: Regístrese e inicie sesión para obtener la clave API para configurar xx en su flujo de trabajo.

4. Sitio web oficial de Gemini

A través de gemini.google.com, los usuarios pueden acceder directamente al modelo Gemini 2.5 Pro.
Regístrate para actualizar ChatGPT | Claude 3 | Tutorial de actualización de GPT-5

Prueba gratuita: los nuevos usuarios pueden actualizar a Gemini Advanced de forma gratuita y disfrutar de un servicio de prueba gratuito de un mes.

Requisitos: Se requiere una nueva identidad de usuario y la vinculación de una tarjeta de crédito. Se recomiendan tarjetas de crédito tipo Visa o Mastercard.

Empezando en cinco minutos

A. ¿Necesita Google AI Studio o llamadas REST directas?

Estudio de inteligencia artificial de Google es la rampa de acceso más rápida: inicia sesión con cualquier cuenta de Google, crea indicaciones en una interfaz de usuario similar a un cuaderno y luego haz clic “Obtener clave API” para obtener un token ya limitado al nivel experimental.
REST directo / gRPC Es mejor para las canalizaciones de CI. Usar https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContent con tu llave en la key parámetro de consulta o como un token de portador.

B. Ejemplo de rizo para una indicación multimodal

bashcurl -s \
  -H "Authorization: Bearer $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -X POST \
  -d '{
    "contents":[
      {"parts":},
      {"mimeType":"image/png","data":"$(base64 -w0 chart.png)"}
    ]
  }' \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContent"

¿Cuáles son los nuevos problemas con el límite de velocidad?

"¿Por qué veo errores 429 incluso por debajo de los límites documentados?"

Google añadió silenciosamente límites de ráfaga: no se pueden superar las 120 solicitudes en un período consecutivo de cinco minutos, independientemente del RPM. Implementar cubo de fichas lógica de retroceso o utilice el cliente integrado que reconoce las cuotas en el google‑generativeai Kit de desarrollo de software de Python v0.6.0.

“¿Puedo combinar 1.5 Pro y 2.5 Pro en el mismo proyecto para ahorrar espacio?”

Sí, pero las cuotas son agrupados por familia de modelosLas llamadas a 1.5 Pro aún cuentan para la cuota de solicitud diaria de 2.5 Pro en el nivel experimental, porque ambas caen dentro del “Modelos de pensamiento” Grupo de cuotas. Divide las cargas de trabajo en proyectos de Google Cloud independientes si deseas cuotas aisladas.

Actualizaciones de seguridad y cumplimiento que no debes ignorar

1. Residencia de datos y RGPD

El registro para 2.5 Pro continúa en la región para clientes de la UE a través del punto final regional de la UE de Google Cloud, lo que satisface las recomendaciones de Schrems II, una actualización del enrutamiento global utilizado por las versiones 1.0 y 1.5.

2. Auditabilidad

New Pensando en rastros Permite a los clientes empresariales de Vertex AI registrar los pasos de razonamiento latente del modelo para su auditoría. Los rastros se almacenan cifrados durante 14 días y se pueden exportar a BigQuery. Esta función no está disponible en el nivel experimental gratuito.

3. Seguridad del contenido

Gemini 2.5 Pro hereda el “filtros de seguridad v2” tubería, añadiendo una más estricta clasificador de autolesiones Se ajustaron las 50 XNUMX publicaciones de Reddit marcadas por las líneas directas de crisis, una respuesta directa a la Ley de Seguridad en Línea del Reino Unido del año pasado. IT Pro

Puntos de referencia de rendimiento: ¿dónde brilla Gemini 2.5 Pro?

️Generación de código

Los puntos de referencia de HumanEval+ muestran una 9 % de ganancia absoluta más de 1.5 Pro y una ventaja del 2 % sobre GPT‑4o, con configuraciones de temperatura idénticas = 0.

Análisis de datos

En el conjunto de datos GSM-Hard, 2.5 Pro obtiene una puntuación del 94 %, frente al 88 % de 1.5 Pro y el 92 % de Claude 3 Haiku. La mejora se atribuye directamente al ejecutor "pensante".

Preguntas y respuestas sobre la visión

En el índice de referencia MMMU razonamiento de diagrama El subconjunto 2.5 Pro iguala a Gemini 2.0 Flash con un 87 %, pero queda por detrás de GPT‑4o (89 %). Por lo tanto, los desarrolladores multimodales deberían conservar Flash para tareas de visión pura.

Integraciones anunciadas en Google Cloud Next 2025

¿Cómo ejecuto la versión 2.5 Pro con otros servicios de inteligencia artificial de Google?

Motor de agente de IA Vertex – cadena 2.5 Pro con agentes específicos para tareas como Code Assist o Document AI.
TPU v7 Ironwood – Los trabajos de entrenamiento cambian automáticamente a Ironwood cuando se ajustan más de 1 B de tokens, lo que reduce los costos en un 35 %.
Protocolo Agentspace/Agente a Agente – especificación de código abierto para que los agentes 2.5 Pro puedan llamar a pares Anthropic u OpenAI.

Lista de verificación de migración para equipos que actualizan desde la versión 1.5 Pro

Intercambiar nombre de modelo – actualización de gemini-1.5-pro-latest a gemini-2.5-pro-exp-03-25.
Aumentar el contexto/tiempo de espera - colocar timeout = 600 s para contextos grandes.
Comprobar la configuración de seguridad – los valores predeterminados son más estrictos; ajuste safetySettings según sea necesario.
Volver a ajustar la temperatura – 2.5 Pro es más determinista; aumenta la temperatura en 0.2 para tareas creativas.
Reevaluar la cuota – el nivel gratuito ofrece más tokens por minuto, pero menos solicitudes; llamadas por lotes.

Errores frecuentes

“Las respuestas de streaming se bloquean al alcanzar los 256 XNUMX tokens: ¿un error?”

No. El punto final experimental transmite correctamente hasta 512 k tokens de salida, pero muchas bibliotecas cliente aún utilizan un búfer de lectura de 256 k por defecto. Aumente el búfer o cambie a HTTP/2.

“¿Por qué las imágenes vuelven ocasionalmente? `INVALID_ARGUMENT`? "

Gemini rechaza imágenes de más de 20 MB o con etiquetas GPS EXIF en el plan gratuito para evitar el abuso. Elimine los metadatos o comprímalos.

Hoja de ruta: ¿qué sigue para el acceso gratuito a Gemini?

Las notas de la versión de Google insinúan 2 contextos de tokens M y Variantes cuantificadas de Edge TPU más adelante en 2025. Los analistas de la industria esperan una “Gemini Edge” modelo que puede ejecutarse completamente en el dispositivo para Android 16, reflejando el rumoreado Ajax-Edge de Apple.

Conclusión

El nivel experimental gratuito de Gemini 2.5 Pro es lo suficientemente generoso para el prototipado rápido, a la vez que ofrece una ruta directa hacia un uso de pago de mayor rendimiento. El ejecutor de pensamiento integrado del modelo, la amplia ventana de contexto y la profunda integración con Vertex AI lo convierten en una base atractiva para las aplicaciones de la era 2025, desde compañeros de código y copilotos de datos hasta bots multimodales de búsqueda y cumplimiento normativo. Adopciónelo ahora para preparar su pila para el futuro, pero planifique la gestión de cuotas, valores predeterminados de seguridad más estrictos y la evolución de los nombres de los endpoints a medida que Google itera en las fases de vista previa.