ModelosPreciosEmpresa
500+ API de Modelos de IA, Todo en Una API. Solo en CometAPI
API de Modelos
Desarrollador
Inicio RápidoDocumentaciónPanel de API
Empresa
Sobre nosotrosEmpresa
Recursos
Modelos de IABlogRegistro de cambiosSoporte
Términos de ServicioPolítica de Privacidad
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

Entrada:$0.24/M
Salida:$2/M
Contexto:1M
Salida Máxima:65K
Gemini 2.5 Flash es un modelo de IA desarrollado por Google, diseñado para ofrecer soluciones rápidas y rentables para desarrolladores, especialmente para aplicaciones que requieren capacidades de inferencia mejoradas. Según el anuncio de vista previa de Gemini 2.5 Flash, el modelo se lanzó en vista previa el 17 de abril de 2025, admite entrada multimodal y tiene una ventana de contexto de 1 millón de tokens. Este modelo admite una longitud máxima de contexto de 65,536 tokens.
Nuevo
Uso comercial
Playground
Resumen
Características
Precios
API
Versiones

Gemini 2.5 Flash está diseñado para ofrecer respuestas rápidas sin comprometer la calidad del resultado. Admite entradas multimodales, incluidas texto, imágenes, audio y video, lo que lo hace adecuado para aplicaciones diversas. El modelo es accesible a través de plataformas como Google AI Studio y Vertex AI, proporcionando a los desarrolladores las herramientas necesarias para una integración fluida en diversos sistemas.


Información básica (Características)

Gemini 2.5 Flash introduce varias características destacadas que lo distinguen dentro de la familia Gemini 2.5:

  • Razonamiento híbrido: Los desarrolladores pueden configurar un parámetro thinking_budget para controlar con precisión cuántos tokens dedica el modelo al razonamiento interno antes de producir la salida.
  • Frontera de Pareto: Posicionado en el punto óptimo de costo-rendimiento, Flash ofrece la mejor relación precio-inteligencia entre los modelos 2.5.
  • Compatibilidad multimodal: Procesa de forma nativa texto, imágenes, video y audio, lo que habilita capacidades conversacionales y analíticas más ricas.
  • Contexto de 1 millón de tokens: Una longitud de contexto sin igual permite un análisis profundo y la comprensión de documentos largos en una sola solicitud.

Versionado del modelo

Gemini 2.5 Flash ha pasado por las siguientes versiones clave:

  • gemini-2.5-flash-lite-preview-09-2025: Usabilidad de herramientas mejorada: rendimiento mejorado en tareas complejas y de múltiples pasos, con un aumento del 5% en las puntuaciones de SWE-Bench Verified (del 48.9% al 54%). Eficiencia mejorada: al habilitar el razonamiento, se logra una salida de mayor calidad con menos tokens, reduciendo la latencia y los costos.
  • Versión preliminar 04-17: Lanzamiento de acceso anticipado con capacidad de “thinking”, disponible a través de gemini-2.5-flash-preview-04-17.
  • Disponibilidad general (GA) estable: Desde el 17 de junio de 2025, el endpoint estable gemini-2.5-flash reemplaza la versión preliminar, garantizando fiabilidad de nivel de producción sin cambios de API respecto a la versión preliminar del 20 de mayo.
  • Retirada de la versión preliminar: Los endpoints de la versión preliminar estaban programados para apagarse el 15 de julio de 2025; los usuarios deben migrar al endpoint GA antes de esta fecha.

A partir de julio de 2025, Gemini 2.5 Flash está ahora disponible públicamente y es estable (sin cambios respecto a gemini-2.5-flash-preview-05-20). Si está usando gemini-2.5-flash-preview-04-17, la tarificación existente de la versión preliminar continuará hasta la retirada programada del endpoint del modelo el 15 de julio de 2025, cuando se desactivará. Puede migrar al modelo de disponibilidad general "gemini-2.5-flash".

Más rápido, más barato, más inteligente:

  • Objetivos de diseño: baja latencia + alto rendimiento + bajo costo;
  • Aceleración general en razonamiento, procesamiento multimodal y tareas de texto largo;
  • El uso de tokens se reduce en un 20–30%, reduciendo significativamente los costos de razonamiento.

Especificaciones técnicas

Ventana de contexto de entrada: hasta 1 millón de tokens, lo que permite una amplia retención de contexto.

Tokens de salida: capaz de generar hasta 8,192 tokens por respuesta.

Modalidades compatibles: texto, imágenes, audio y video.

Plataformas de integración: disponible a través de Google AI Studio y Vertex AI.

Precios: modelo competitivo basado en tokens, que facilita un despliegue rentable.


Detalles técnicos

En su funcionamiento interno, Gemini 2.5 Flash es un modelo de lenguaje grande basado en transformers entrenado con una mezcla de datos de la web, código, imágenes y video. Las principales especificaciones técnicas incluyen:

Entrenamiento multimodal: Entrenado para alinear múltiples modalidades, Flash puede mezclar sin problemas texto con imágenes, video o audio, útil para tareas como el resumen de video o la generación de descripciones de audio.

Proceso de pensamiento dinámico: Implementa un bucle de razonamiento interno en el que el modelo planifica y descompone instrucciones complejas antes de la salida final.

Presupuestos de pensamiento configurables: El thinking_budget puede establecerse desde 0 (sin razonamiento) hasta 24,576 tokens, permitiendo equilibrar la latencia y la calidad de la respuesta.

Integración de herramientas: Admite Grounding con Google Search, Ejecución de código, Contexto de URL e Invocación de funciones, habilitando acciones del mundo real directamente desde instrucciones en lenguaje natural.


Rendimiento en pruebas comparativas

En evaluaciones rigurosas, Gemini 2.5 Flash demuestra un rendimiento líder en la industria:

  • LMArena Hard Prompts: Se ubicó en segundo lugar, solo por detrás de 2.5 Pro en el exigente benchmark Hard Prompts, lo que demuestra sólidas capacidades de razonamiento de múltiples pasos.
  • Puntuación MMLU de 0.809: Supera el rendimiento promedio de los modelos con una precisión MMLU de 0.809, lo que refleja su amplio conocimiento de dominios y su destreza de razonamiento.
  • Latencia y rendimiento: Alcanza una velocidad de decodificación de 271.4 tokens/sec con un Tiempo hasta el primer token de 0.29 s, lo que lo hace ideal para cargas de trabajo sensibles a la latencia.
  • Líder en precio-rendimiento: Con \$0.26/1 M tokens, Flash supera a muchos competidores en precio mientras iguala o supera sus resultados en benchmarks clave.

Estos resultados indican la ventaja competitiva de Gemini 2.5 Flash en razonamiento, comprensión científica, resolución de problemas matemáticos, programación, interpretación visual y capacidades multilingües:


Limitaciones

Si bien es potente, Gemini 2.5 Flash presenta ciertas limitaciones:

  • Riesgos de seguridad: El modelo puede mostrar un tono “aleccionador” y puede producir resultados plausibles pero incorrectos o sesgados (alucinaciones), especialmente en consultas de casos límite. La supervisión humana rigurosa sigue siendo esencial.
  • Límites de tasa: El uso de la API está restringido por límites de tasa (10 RPM, 250,000 TPM, 250 RPD en los niveles predeterminados), lo que puede afectar el procesamiento por lotes o las aplicaciones de alto volumen.
  • Nivel mínimo de inteligencia: Aunque es excepcionalmente capaz para un modelo flash, sigue siendo menos preciso que 2.5 Pro en las tareas agentivas más exigentes, como la programación avanzada o la coordinación multiagente.
  • Compensaciones de costos: Aunque ofrece la mejor relación precio-rendimiento, el uso extensivo del modo thinking aumenta el consumo total de tokens, elevando los costos para instrucciones que requieren razonamiento profundo.

Características para Gemini 2.5 Flash

Explora las características clave de Gemini 2.5 Flash, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Precios para Gemini 2.5 Flash

Explora precios competitivos para Gemini 2.5 Flash, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo Gemini 2.5 Flash puede mejorar tus proyectos mientras mantienes los costos manejables.

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Código de ejemplo y API para Gemini 2.5 Flash

Gemini 2.5 Flash API es el modelo de IA multimodal más reciente de Google, diseñado para tareas de alta velocidad y eficientes en costos, con capacidades de razonamiento controlables, que permite a los desarrolladores activar o desactivar funciones avanzadas de "pensamiento" a través de la Gemini API.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-2.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            { text: "Tell me a three sentence bedtime story about a unicorn." },
          ],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Tell me a three sentence bedtime story about a unicorn."
          }
        ]
      }
    ]
  }'

Versiones de Gemini 2.5 Flash

La razón por la cual Gemini 2.5 Flash tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.
version
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash
gemini-2.5-flash-image
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-thinking
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-image-preview
gemini-2.5-flash-preview-04-17

Más modelos

C

Claude Opus 4.7

Entrada:$3/M
Salida:$15/M
El modelo más inteligente para agentes y programación
A

Claude Sonnet 4.6

Entrada:$2.4/M
Salida:$12/M
Claude Sonnet 4.6 es nuestro modelo Sonnet más capaz hasta la fecha. Es una actualización completa de las capacidades del modelo en programación, uso de computadoras, razonamiento con contexto largo, planificación de agentes, trabajo del conocimiento y diseño. Sonnet 4.6 también ofrece una ventana de contexto de 1M de tokens en beta.
O

GPT 5.5 Pro

Entrada:$24/M
Salida:$144/M
Un modelo avanzado diseñado para lógica extremadamente compleja y exigencias profesionales, que representa el estándar más alto de razonamiento profundo y capacidades analíticas precisas.
O

GPT 5.5

Entrada:$4/M
Salida:$24/M
Un modelo insignia multimodal de próxima generación que equilibra un rendimiento excepcional con una capacidad de respuesta eficiente, dedicado a proporcionar servicios de IA de propósito general integrales y estables.
O

GPT Image 2 ALL

Por Solicitud:$0.04
GPT Image 2 es el modelo de generación de imágenes de vanguardia de OpenAI para una generación y edición de imágenes rápidas y de alta calidad. Admite tamaños de imagen flexibles y entradas de imagen de alta fidelidad.
O

GPT 5.5 ALL

Entrada:$4/M
Salida:$24/M
GPT-5.5 destaca en escritura de código, investigación en línea, análisis de datos y operaciones entre herramientas. El modelo no solo mejora su autonomía para manejar tareas complejas de múltiples pasos, sino que también mejora significativamente las capacidades de razonamiento y la eficiencia de ejecución, manteniendo la misma latencia que su predecesor, lo que marca un paso importante hacia la automatización de oficina impulsada por IA.

Blog relacionado

Nano Banana 2 Flash Próximamente – La evolución de alta velocidad de la generación de imágenes con IA
Jan 6, 2026
nano-banana-2

Nano Banana 2 Flash Próximamente – La evolución de alta velocidad de la generación de imágenes con IA

Google ha vuelto a sacudir el panorama de la IA generativa con el Nano Banana 2 Flash Próximamente, la última incorporación a su ampliamente aclamada familia de generación de imágenes "Nano Banana". Tras el gran éxito de Nano Banana Pro (Gemini 3 Pro Image) a finales del año pasado, esta nueva iteración promete democratizar la síntesis visual de nivel profesional al combinar la inteligencia de vanguardia de la arquitectura Gemini 3 con una velocidad y eficiencia sin precedentes.
Descuentos de Nano Banana: Un verdadero ahorro de dinero en 2026 para desarrolladores
Dec 25, 2025
nano-banana-pro

Descuentos de Nano Banana: Un verdadero ahorro de dinero en 2026 para desarrolladores

En conclusión: La API oficial de Nano Banana no ofrece ningún descuento por Navidad, Año Nuevo ni otras festividades. Este es un hecho que todos los desarrolladores que planeen usar Nano Banana (incluido Nano Banana Pro) para la generación de imágenes, la creación de contenido o la integración de productos en 2026 deben comprender. Google no ofrece descuentos estacionales para la API de Nano Banana, ya sea Navidad, Black Friday o Año Nuevo. El sistema de precios de la API oficial se mantiene estable y transparente de forma constante, con prácticamente ningún margen para descuentos. Entonces, la pregunta es: si eres desarrollador y planeas realizar generación de imágenes a gran escala, pruebas de modelos o iteraciones de producto durante Navidad o Año Nuevo, ¿hay alguna manera de reducir el costo de usar Nano Banana?
¿La API gratuita de Gemini 2.5 Pro está caída? Cambios en la cuota gratuita en 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

¿La API gratuita de Gemini 2.5 Pro está caída? Cambios en la cuota gratuita en 2025

Google ha endurecido drásticamente el nivel gratuito de la Gemini API: Gemini 2.5 Pro ha sido eliminado del nivel gratuito y las solicitudes gratuitas diarias de Gemini 2.5 Flash fueron recortadas drásticamente (reportes: ~250 → ~20/día). Eso no significa que el modelo esté "muerto" permanentemente para la experimentación — pero sí significa que el acceso gratuito ha sido efectivamente desmantelado para muchos casos de uso del mundo real.
Guía definitiva de Nano-Banana: cómo usarlo y obtener el mejor resultado
Sep 8, 2025
gemini-2-5-flash-image

Guía definitiva de Nano-Banana: cómo usarlo y obtener el mejor resultado

El reciente lanzamiento de Gemini 2.5 Flash Image de Google, apodado “Nano-Banana”, se ha convertido rápidamente en la opción preferida para la edición de imágenes conversacionales: conserva las semejanzas
¿Cómo usar Nano Banana mediante API? (Gemini-2-5-flash-image)
Aug 28, 2025
gemini-2-5-flash-image

¿Cómo usar Nano Banana mediante API? (Gemini-2-5-flash-image)

Nano Banana es el apodo de la comunidad (y la abreviatura interna) para Gemini 2.5 Flash Image de Google: un sistema de generación de imágenes multimodal de baja latencia y alta calidad +