Specyfikacja techniczna Gemini 3.5 Flash
| Pozycja | Gemini 3.5 Flash |
|---|---|
| Dostawca | |
| Rodzina modeli | Gemini 3.5 |
| Oficjalny ID modelu | gemini-3.5-flash |
| Typy wejściowe | Tekst, obraz, wideo, audio, PDF |
| Typy wyjściowe | Tekst |
| Okno kontekstu | 1 milion tokenów |
| Maks. liczba tokenów wyjściowych | ~65K tokenów wyjściowych |
| Główne atuty | Agentowe przepływy pracy, kodowanie, multimodalne rozumowanie |
| Obsługa narzędzi | Wywoływanie funkcji, wykonywanie kodu, grounding wyszukiwania, strukturyzowane wyjścia, kontekst URL, wyszukiwanie plików |
| Wsparcie rozumowania | Regulowane poziomy myślenia/rozumowania |
| Ramy bezpieczeństwa | Google Frontier Safety Framework |
Czym jest Gemini 3.5 Flash?
Google Gemini 3.5 Flash to flagowy, szybki, multimodalny model rozumowania firmy Google, zoptymalizowany pod kątem agentowego wykonywania zadań, kodowania i długotrwałych przepływów pracy. Rozszerza serię Gemini Flash o znacząco silniejsze możliwości rozumowania i inżynierii oprogramowania, zachowując niską latencję wnioskowania.
W odróżnieniu od wcześniejszych modeli Flash skoncentrowanych głównie na lekkim wnioskowaniu, Gemini 3.5 Flash został zaprojektowany z myślą o trwałych agentach AI, wieloetapowych systemach kodowania oraz korporacyjnych potokach automatyzacji. Google pozycjonuje go jako najsilniejszy dotąd model agentowy w warstwie Flash.
Główne funkcje Gemini 3.5 Flash
- 1M tokenów długiego kontekstu: Obsługuje niezwykle duże repozytoria, obszerne dokumentacje, PDF-y, transkrypcje i wielosesyjne przepływy w ramach jednego kontekstu promptu.
- Silne wykonywanie agentowe: Zoptymalizowany pod kątem wieloetapowych autonomicznych przepływów, orkiestracji narzędzi, zadań terminalowych i długo działających agentów AI.
- Zaawansowana wydajność w kodowaniu: Przewyższa Gemini 3.1 Pro w kilku benchmarkach kodowania i agentowych, w tym Terminal-Bench i MCP Atlas.
- Natywne multimodalne rozumowanie: Akceptuje tekst, obrazy, audio, wideo i PDF-y do zadań zintegrowanego rozumowania.
- Narzędzia klasy produkcyjnej: Obsługuje strukturyzowane wyjścia, wywoływanie funkcji, wykonywanie kodu, grounding przy użyciu Google Search i Maps oraz wyszukiwanie plików.
- Konfigurowalne tryby rozumowania/myślenia: Deweloperzy mogą dostrajać kompromis między latencją a głębokością rozumowania za pomocą poziomów myślenia.
Wyniki w benchmarkach Gemini 3.5 Flash
Zgłoszone przez Google wyniki benchmarków plasują Gemini 3.5 Flash wśród najsilniejszych modeli agentowych w warstwie Flash dostępnych obecnie:
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Wyniki te wskazują na duże postępy w autonomicznym wykonywaniu zadań, multimodalnym rozumowaniu i niezawodności inżynierii oprogramowania w porównaniu z wcześniejszymi wariantami Gemini Flash.
Gemini 3.5 Flash vs inne modele
| Zdolność | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Okno kontekstu | 1M tokenów | Duży kontekst | Duży kontekst |
| Agentowe przepływy | Znakomity | Mocny | Mocny |
| Wydajność w kodowaniu | Bardzo mocna | Mocna | Znakomita |
| Szybkość wnioskowania | Zoptymalizowana latencja Flash | Wolniejsza | Umiarkowana |
| Wejścia multimodalne | Natywne multimodalne | Natywne multimodalne | Wizja + tekst |
| Ekosystem narzędzi | Rozbudowany zestaw narzędzi Google | Rozbudowany | Silne narzędzia API |
Kluczowe różnice
- vs Gemini 3.1 Pro: Gemini 3.5 Flash zapewnia lepsze kodowanie i autonomiczne wykonywanie zadań, jednocześnie utrzymując znacząco szybsze wnioskowanie.
- vs Claude Sonnet 4: Claude często pozostaje silniejszy w niuansowym długim rozumowaniu i jakości pisania, podczas gdy Gemini 3.5 Flash kładzie nacisk na szybkość, wykonanie agentowe oraz integrację z ekosystemem Google.
- vs modele rozumowania z serii GPT: Gemini 3.5 Flash jest szczególnie konkurencyjny w multimodalnych przepływach agentowych i orkiestracji dużych kontekstów, zwłaszcza w zastosowaniach automatyzacji przedsiębiorstw.
Znane ograniczenia Gemini 3.5 Flash
- Obecnie nie obsługuje natywnej generacji obrazów ani dźwięku w wyjściach.
- W tym poziomie modelu nie są obsługiwane konwersacyjne interfejsy API na żywo.
- Benchmarki społeczności pokazują zróżnicowaną wydajność w niektórych specjalistycznych zadaniach ewaluacyjnych, zwłaszcza w wąskich przepływach silnie zależnych od wizji.
Jak uzyskać dostęp do Gemini 3.5 Flash API
Krok 1: Uzyskaj dostęp do API
Zaloguj się do cometAPI. Jeśli nie jesteś jeszcze naszym użytkownikiem, zarejestruj się najpierw. Zaloguj się do swojej CometAPI console. Uzyskaj klucz API dostępu do interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i zatwierdź.

Krok 2: Wysyłaj żądania do Gemini 3.5 Flash API
Wybierz endpoint „` gemini-3.5-flash” do wysłania żądania API i ustaw body żądania. Metodę i body żądania znajdziesz w naszej dokumentacji API na stronie. Nasza strona udostępnia również test w Apifox dla Twojej wygody. Zamień <YOUR_API_KEY> na faktyczny klucz CometAPI z Twojego konta. bazowy URL to Gemini Generating Content
Wstaw swoje pytanie lub prośbę w polu content — na to odpowie model. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Krok 3: Przetwarzaj odpowiedzi
API zwraca ustrukturyzowane propozycje odpowiedzi, w tym generowany tekst, cytowania, metadane bezpieczeństwa oraz opcjonalne wyjścia narzędzi.