Jak korzystać z interfejsu API Gemini 3.5 Flash

CometAPI
AnnaMay 20, 2026
Jak korzystać z interfejsu API Gemini 3.5 Flash

Google zaprezentowało Gemini 3.5 Flash na Google I/O 2026 jako najnowszy model z serii Flash, oferujący inteligencję na poziomie czołowych modeli przy szybkości i koszcie klasy Flash. Wydany około 19 maja 2026 r., łączy zaawansowane rozumowanie, silne zdolności agentowe oraz multimodalne rozumienie, zachowując niskie opóźnienia.

Model wyróżnia się dla deweloperów, przedsiębiorstw i twórców rozwiązań AI, którzy potrzebują wysokiej wydajności bez narzutu większych modeli „Pro”. Dorównuje lub przewyższa wcześniejsze modele Pro w kluczowych benchmarkach agentowych i kodowych, oferując jednocześnie lepszą szybkość i efektywność.

Key Highlights (Struktura wyróżnionego fragmentu (Featured Snippet)):

  • Performance: Przewyższa Gemini 3.1 Pro w Terminal-Bench 2.1 (76.2% vs. 70.3%), MCP Atlas (83.6%) i innych.
  • Speed: Opóźnienia klasy Flash dla zastosowań w czasie rzeczywistym i dużej skali.
  • Context: Do 1M tokenów wejściowych, 64k tokenów wyjściowych.
  • Multimodal: Natywna obsługa tekstu, obrazów, wideo, audio, PDF.
  • Pricing: Około $1.50 / 1M tokenów wejściowych i $9 / 1M tokenów wyjściowych (zależnie od dostawcy/platformy).

Dla bezproblemowej integracji CometAPI zapewnia ujednolicony, niezawodny proxy do modeli Gemini (i wielu innych) z rozszerzonymi limitami przepustowości, uproszczonym rozliczaniem, trasowaniem awaryjnym (fallback) i analityką użycia — idealne dla aplikacji produkcyjnych skalowanych na Gemini 3.5 Flash.

What is Gemini 3.5 Flash?

Gemini 3.5 Flash to najbardziej inteligentny model klasy Flash od Google, zaprojektowany do utrzymywania frontierowej wydajności w zadaniach agentowych i kodowych na dużą skalę. Bazuje na serii Gemini 3, łącząc rozumowanie na poziomie Pro z efektywnością klasy Flash.

W przeciwieństwie do lżejszych wariantów „Lite” nastawionych wyłącznie na koszt lub cięższych modeli Pro maksymalizujących inteligencję, 3.5 Flash błyszczy w realnych, wieloetapowych scenariuszach: wdrażaniu subagentów, szybkich iteracjach kodu („vibe coding”), równoległym użyciu narzędzi i długohoryzontalnych przepływach wymagających utrzymania kontekstu przez wiele tur.

Core Capabilities:

  • Multimodal Inputs: Tekst, obrazy, wideo, audio, PDF.
  • Tools & Agentic Features: Wywoływanie funkcji, wykonywanie kodu, uzasadnienie w oparciu o wyszukiwanie, wyszukiwanie w plikach, kontekst URL. (Computer Use nie jest jeszcze obsługiwane.)
  • Thinking Modes: Konfigurowalne poziomy wysiłku dla równoważenia głębi vs. szybkości.
  • Production-Ready: Status GA ze stabilnym wersjonowaniem (gemini-3.5-flash).

Obsługuje kontekst 1M tokenów, co umożliwia przetwarzanie masywnych dokumentów, baz kodu lub historii rozmów — kluczowe dla złożonych agentów.

What's New in Gemini 3.5 Flash

W porównaniu z Gemini 3 Flash i 3.1 Pro, 3.5 Flash przynosi istotne ulepszenia:

  • Improved Agentic Performance: O 42% lepszy wynik na długodystansowych, wieloturnowych benchmarkach cyber przy 72% redukcji tokenów w niektórych przypadkach.
  • Better Coding: Prowadzi w Terminal-Bench i wariantach SWE-Bench dla realnych przepływów pracy deweloperów.
  • Enhanced Multimodal Reasoning: Najwyższe wyniki w CharXiv (84.2%) i MMMU-Pro.
  • Parallel Sub-Agent Coordination: Natywne wsparcie złożonej orkiestracji wieloagentowej (pokazane w przykładach Antigravity, np. migracja kodu i tworzenie gier).
  • Efficiency Gains: Utrzymuje lub poprawia szybkość przy jednoczesnym wzroście inteligencji, co czyni go odpowiednim do zastosowań o dużym wolumenie.

Benchmark Comparison Table:

BenchmarkGemini 3.5 FlashGemini 3 FlashGemini 3.1 ProNotes
Terminal-Bench 2.1 (Agentic)76.2%58.0%70.3%Strong coding lead
MCP Atlas (Multi-step)83.6%62.0%78.2%Agentic workflows
CharXiv (Multimodal)84.2%80.3%83.3%Chart reasoning
GDPval-AA (Elo)165612041314Knowledge work
MMMU-Pro83.6%81.2%80.5%Multimodal

Użytkownicy z rzeczywistości (np. Shopify, Macquarie Bank, Salesforce) raportują poprawę w prognozowaniu, przetwarzaniu dokumentów i automatyzacji korporacyjnej.

Behavior Adjustments and Key Changes

Google wprowadziło ważne aktualizacje behawioralne dla lepszej efektywności i spójności.

New Default Effort Level: Medium

Domyślny thinking_level zmienił się z high (we wcześniejszych wersjach preview) na medium. Zapewnia to doskonałe wyniki w większości zadań przy niższych opóźnieniach i kosztach. Używaj high do najbardziej złożonego rozumowania.

Effort Level Comparison Table:

Effort LevelBest ForLatency/Cost ImpactRecommended Use Cases
minimalQuick responsesLowestChat, simple facts, basic routing
lowFewer-step agentic/codeLowAnalysis, writing, quick tools
medium (default)Most tasksBalancedComplex code, standard agents
highDeep reasoningHigherHard math, toughest agent tasks

Code Example (Python - Setting Thinking Level):

Python

from google import genai
from google.genai import types

client = genai.Client()  # Assumes API key configured via env or auth

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Prove that the square root of 2 is irrational.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="high")
    ),
)
print(response.text)

Podobne wzorce dotyczą JavaScript, REST itd.

Thought Preservation

Model automatycznie utrzymuje pośrednie rozumowanie w rozmowach wieloturnowych, gdy przekazywana jest pełna historia (włącznie z sygnaturami rozumowania). Zwiększa to wydajność w iteracyjnym debugowaniu, refaktoryzacji i długich sesjach agentów — bez dodatkowych zmian API dla Interactions API; GenerateContent zyskuje na przekazywaniu pełnej historii.

Parameter Updates (Gemini 3.x Best Practices)

  • Unikaj ręcznej regulacji temperature, top_p, top_k — domyślne wartości są zoptymalizowane.
  • Używaj thinking_level zamiast numerycznego thinking_budget.
  • Ścisłe dopasowanie odpowiedzi funkcji (id, name, count) jest kluczowe, aby uniknąć pustych odpowiedzi.

How to Access and Use Gemini 3.5 Flash API

1. Access Options:

  1. Google AI Studio (najprostsze do testów) — Dostępny darmowy poziom.
  2. Gemini API (bezpośrednio z kluczem API).
  3. Vertex AI / Gemini Enterprise Agent Platform (funkcje korporacyjne, wyższe limity).
  4. Podmioty trzecie jak CometAPI (zalecane dla uproszczonego dostępu do wielu dostawców, analityki i niezawodności).

Get Started with CometAPI: CometAPI agreguje dostęp do modeli Gemini przez pojedynczy endpoint, zapewnia lepszą obsługę błędów, pulpity do monitorowania użycia i alerty kosztowe. Zarejestruj się na Cometapi.com, pobierz klucz i kieruj żądania do gemini-3.5-flash (lub równoważnego ID modelu) przy minimalnych zmianach w kodzie. Idealne do skalowania bez zarządzania wieloma kluczami API lub bezpośredniego zmagania się z limitami zapytań.

2. Basic Setup and Hello World

Python Quickstart:

import osfrom google import genaifrom google.genai import types​# Configure client (API key from env or Google auth)genai.configure(api_key=os.environ["GEMINI_API_KEY"])  # Or use Client() with defaults​client = genai.Client()​response = client.models.generate_content(    model="gemini-3.5-flash",    contents="Explain parallel agentic execution in three sentences.",)print(response.text)

JavaScript Example:

import { GoogleGenAI } from "@google/genai";​const ai = new GoogleGenAI({});​async function main() {  const response = await ai.models.generateContent({    model: "gemini-3.5-flash",    contents: "Explain parallel agentic execution in three sentences.",  });  console.log(response.text);}​main();

REST API Curl:

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \  -H "x-goog-api-key: $GEMINI_API_KEY" \  -H 'Content-Type: application/json' \  -X POST \  -d '{    "contents": [{      "parts": [{"text": "Hello, Gemini 3.5 Flash!"}]    }]  }'```<grok-card data-id="a39ea3" data-type="citation_card" data-plain-type="render_inline_citation" ></grok-card>​​

3. Advanced Usage: Multimodal, Function Calling, and Agents

Multimodal Example (Image + Text):

# Assuming you have an image file or bytesimage_part = types.Part.from_bytes(data=image_bytes, mime_type="image/jpeg")​response = client.models.generate_content(    model="gemini-3.5-flash",    contents=[image_part, "Describe this image in detail and suggest improvements."],)

Function Calling for Agentic Workflows:

Zdefiniuj narzędzia, pozwól modelowi je wywołać, a następnie przekaż odpowiedzi (ściśle dopasowując id/name).

Structured Outputs:

Używaj schematów odpowiedzi do niezawodnego parsowania JSON — idealne do potoków ekstrakcji danych.

Code Execution Tool:

Włącz, aby model mógł uruchamiać kod Pythona w piaskownicy na potrzeby matematyki, analizy danych itd.

W pełnych środowiskach agentowych rozważ Managed Agents Google (preview) lub zbuduj własne z Cometapi.com do orkiestracji, logowania i kontroli kosztów.

Advice for Gemini 3.5 Flash API

  1. Wykorzystuj domyślny poziom medium — nadpisuj tylko gdy to konieczne.
  2. Przekazuj pełną historię dla zachowania toku rozumowania w czatach/agentach.
  3. Używaj buforowania kontekstu przy powtarzających się dużych promptach (znaczne oszczędności).
  4. Ściśle obsługuj odpowiedzi narzędzi, aby zapobiegać awariom.
  5. Monitoruj tokeny — kontekst 1M jest potężny, ale kosztowny przy niewłaściwym użyciu.
  6. Połącz z Cometapi.com — wdroż inteligentne trasowanie (np. fallback do Flash-Lite dla prostych zapytań), warstwy cache, pulpity użycia i ujednoliconą obsługę błędów. Optymalizuje to wydatki i niezawodność przy dużej skali lub krytycznych zastosowaniach.

Best Practices for Using Gemini 3.5 Flash API

Prompt Engineering:

  • Stosuj jasne, strukturalne prompty z rolami (System + User).
  • Określ format wyjścia (JSON, tabele Markdown).
  • Chain-of-Thought: „Myśl krok po kroku...”

Cost Optimization:

  • Wykorzystuj domyślny „medium” effort.
  • Używaj cache (gdzie wspierane).
  • Monitoruj wykorzystanie tokenów w panelach CometAPI.
  • Grupuj (batchuj) zadania niepilne.

Error Handling & Reliability:

  • Implementuj ponowienia z wykładniczym odstępem.
  • Używaj CometAPI do automatycznych fallbacków na inne modele.

Agentic Design:

  • Dziel złożone zadania na subagentów.
  • Utrzymuj stan dzięki sesjom czatu lub zewnętrznej pamięci.
  • Połącz z Antigravity lub własną orkiestracją.

Real-World Applications and Case Studies

  • Coding Agents: Iteracyjne tworzenie z szybkim sprzężeniem zwrotnym.
  • Enterprise Automation: Przetwarzanie dokumentów, ekstrakcja danych (np. korzyści Box Life Sciences).
  • Multimodal Analysis: Wideo/audio + tekst dla bogatych wglądów.
  • Customer Support Agents: Obsługa rozmów z długim kontekstem.

Integracja przez Cometapi.com pozwala zespołom na testy A/B promptów/modeli, śledzenie ROI per przepływ i skalowanie bez kłopotów infrastrukturalnych.

Comparison: Gemini 3.5 Flash vs. Competitors & Previous Models

Gemini 3.5 Flash oferuje doskonały stosunek ceny do wydajności dla zastosowań agentowych/kodowych. Często jest szybszy i bardziej opłacalny niż pełne modele Pro w wielu zadaniach, jednocześnie zmniejszając lukę w surowej inteligencji.

When to Choose It:

  • Aplikacje o dużej przepustowości (chatboty, asystenci kodowania).
  • Automatyzacja agentowa.
  • Analiza multimodalna wymagająca szybkości.
  • Produkcja z naciskiem na budżet.

Limitations: Nadal pewne niuanse wersji preview/stable; ceny wyższe niż w starszych poziomach Flash dla niektórych wyników. Testuj dokładnie.

Performance Comparison Table (Approximate, Based on Public Reports):

ModelAgentic StrengthSpeedCost (Input/Output)Best For
Gemini 3.5 FlashHigh (Frontier)Very High$1.50 / $9Agents, Coding, Scale
Gemini 3 FlashMedium-HighHighLowerGeneral Fast Tasks
Gemini 3.1 ProVery HighMediumHigherMax Intelligence
Lite VariantsMediumHighestLowestHigh-Volume Simple

Common Pitfalls and Troubleshooting

  • Niedopasowanie odpowiedzi funkcji → Puste wyniki.
  • Nadużywanie effort „high” → Wyższe koszty/opóźnienia.
  • Brak cache dla powtarzalnych kontekstów.
  • Niespodzianki limitów tokenów w długich sesjach.

Conclusion: Start Building with Gemini 3.5 Flash Today

Gemini 3.5 Flash demokratyzuje frontierowe możliwości AI dla zastosowań wrażliwych na szybkość i koszt. Jego wydanie GA, w połączeniu z przemyślanymi aktualizacjami zachowania, takimi jak domyślny średni poziom wysiłku i zachowanie toku rozumowania, czyni go potęgą produkcyjną.

Action Steps:

  1. Get your API key and test .
  2. Zaimplementuj przez SDK zgodnie z powyższymi przykładami kodu.
  3. Skaluj mądrze z Cometapi.com dla proxy, optymalizacji, monitoringu i wsparcia multi-LLM.
  4. Eksperymentuj ze wzorcami agentowymi i dziel się wynikami.

Stosując się do tego przewodnika, skutecznie wykorzystasz Gemini 3.5 Flash, minimalizując ryzyka i koszty. Aby uzyskać bezproblemowe zarządzanie API dostosowane do nowoczesnych przepływów AI, odwiedź CometAPI i zintegrowaj już dziś.

Gotowy na obniżenie kosztów rozwoju AI o 20%?

Zacznij za darmo w kilka minut. Dołączone kredyty na bezpłatny okres próbny. Karta kredytowa nie jest wymagana.

Czytaj więcej