Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Entrada:$0.4/M
Salida:$2.4/M
Contexto:1,048,576
Salida Máxima:65.5k
Gemini 3 Flash es un modelo multimodal de gran escala de Google, ligero y eficiente, diseñado para escenarios del mundo real que requieren respuestas rápidas y baja latencia.
Nuevo
Uso comercial
Playground
Resumen
Características
Precios
API
Versiones

Qué es Gemini 3 Flash

“Gemini 3 Flash” es el miembro Flash/fast de la familia Gemini-3: una variante más ligera, de menor latencia y rentable de los modelos Gemini-3 de Google, pensada para aplicaciones de alto rendimiento de procesamiento, en tiempo real y sensibles a la escala. Una variante de la familia de modelos de la API de Gemini que permite a los desarrolladores invocar, a través de la API de CometAPI (misma interfaz de API que otros modelos Gemini), un modelo de estilo Gemini 3 con baja latencia y optimizado en costos. Expone las mismas entradas multimodales y herramientas de salida estructurada, pero prioriza la velocidad de inferencia y el rendimiento.

Características principales :

  • Baja latencia / alto rendimiento: ajustado para respuestas rápidas y eficiencia de costos (punto de diseño Flash).
  • Compatibilidad con entrada multimodal: texto, imágenes, fragmentos de video y audio en muchas variantes de Flash (las entradas del modelo en la API enumeran los tipos de entrada admitidos por variante).
  • Llamada a funciones y salidas estructuradas: aplicación forzada de salidas JSON/estructuradas para la integración con herramientas y agentes.
  • Compatibilidad con agentes/herramientas: se integra con Google Search grounding, llamadas a funciones/herramientas y frameworks de agentes en el ecosistema de Gemini.

Cómo se compara Gemini 3 Flash con otros modelos

  • Frente a Gemini-3 Pro (misma familia): Flash = optimizado para velocidad/costo; Pro = mayor capacidad de razonamiento, fidelidad multimodal y Deep Think. Elija Flash para interfaces en tiempo real; Pro para tareas sensibles a la precisión.
  • Frente a Gemini anterior (2.5 Flash): la familia Gemini-3 mejora el razonamiento y el rendimiento multimodal; el punto de diseño Flash sigue apuntando a precio/rendimiento. Si actualmente usa 2.5 Flash, Gemini-3 Fast/Flash está pensado para ofrecer mejor calidad con latencia/costo similares.

Casos de uso prácticos (donde gana Flash)

  • Chatbots en tiempo real y agentes de voz: baja latencia para interfaces conversacionales y aplicaciones de audio en streaming.
  • Atención al cliente y resumen de alto volumen: resumen eficiente en costos de transcripciones largas a escala.
  • Inferencia en el edge o embebida donde el tiempo de respuesta importa: utilice variantes estilo flash/lite para SLA estrictos.
  • Canalizaciones de ingestión / análisis masivo de documentos: Flash para indexación y preprocesamiento; escale a Pro para extracción/análisis de alto valor.
  • Asistentes de código en tiempo real / complementos de IDE: completados de código rápidos con menor costo de facturación (valide con Pro para refactorizaciones complejas).

Cómo acceder a la API de Gemini 3 Flash

Paso 1: Regístrese para obtener una clave de API

Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Acceda a su Consola de CometAPI. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.

Paso 2: Envíe solicitudes a la API de Gemini 3 Flash

Seleccione el endpoint “gemini-3-flash” para enviar la solicitud a la API y configure el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también proporciona pruebas en Apifox para su comodidad. Reemplace <YOUR_API_KEY> por su clave real de CometAPI de su cuenta. La URL base es Gemini Generating Content y Chat.

Inserte su pregunta o solicitud en el campo content—esto es a lo que responderá el modelo. Procese la respuesta de la API para obtener la respuesta generada.

Paso 3: Recupere y verifique los resultados

Procese la respuesta de la API para obtener la respuesta generada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.

Consulte también Gemini 3 Pro Preview API

Preguntas Frecuentes

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Características para Gemini 3 Flash

Explora las características clave de Gemini 3 Flash, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Precios para Gemini 3 Flash

Explora precios competitivos para Gemini 3 Flash, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo Gemini 3 Flash puede mejorar tus proyectos mientras mantienes los costos manejables.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Código de ejemplo y API para Gemini 3 Flash

Gemini 3 Flash es un modelo de lenguaje grande (LLM) exclusivamente de texto, expuesto a través de la API alojada de CometAPI (y replicado por capas de inferencia de proveedores). La API admite patrones estándar de chat/completado, respuestas en streaming, invocación de funciones/herramientas, salida JSON estructurada y varios modos de “pensamiento” diseñados para flujos de trabajo de estilo agente (intercalado / preservado / pensamiento a nivel de turno).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versiones de Gemini 3 Flash

La razón por la cual Gemini 3 Flash tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.
ID del modeloDescripciónDisponibilidadSolicitud
gemini-3-flash-allLa tecnología utilizada no es oficial y la generación es inestable, pero Direct Internet, etc.; formato Chat✅formato Chat
gemini-3-flashApunta automáticamente al modelo más reciente✅Generación de contenido de Gemini
gemini-3-flash-previewVista previa oficial✅Generación de contenido de Gemini

Más modelos