Specyfikacje techniczne — Gemini 3.1 Pro

Pozycja	gemini-3-pro (public summary)
Dostawca	Google
Kanoniczny identyfikator modelu	gemini-3-pro (public preview)
Typy wejścia	Text, Image, Video, Audio, PDF
Typy wyjścia	Text (natural language, structured outputs, function-call payloads)
Limit tokenów wejściowych (kontekst)	1,048,576 tokens
Limit tokenów wyjściowych	65,536 tokens
Wywoływanie funkcji / użycie narzędzi	Supported (function calling, structured outputs, tool integrations)
Multimodalność	Full multimodal support (images, video, audio, documents)
Wykonywanie kodu i przepływy agentowe	Supported (agent mode, code assist, tool orchestration)
Data odcięcia wiedzy	January 2025

Czym jest Gemini 3.1 Pro?

Gemini 3.1 Pro to flagowy, publicznie dostępny model Google z rodziny Gemini 3, pozycjonowany jako najnowocześniejszy multimodalny model rozumowania z zaawansowanymi narzędziami agentowymi i deweloperskimi. Model kładzie nacisk na obsługę kontekstu o dużej pojemności (ponad 1M tokenów wejściowych), szerokie wsparcie mediów (obrazy, wideo, audio, PDF) oraz głębokie integracje do użycia narzędzi, wywoływania funkcji i przepływów zorientowanych na kod (np. Gemini Code Assist i tryby agenta).

Gemini 3 Pro jest przedstawiany przez Google jako zoptymalizowany zarówno pod kątem interaktywnych doświadczeń deweloperskich (kodowanie o niskich opóźnieniach i przepływy agentowe), jak i wysokiej wierności rozumienia multimodalnego (interpretacja i wnioskowanie na podstawie zróżnicowanych danych wejściowych).

Główne funkcje Gemini 3.1 Pro

Gemini-3.1 Pro (w wersji Preview) wprowadza następujące funkcje:

Integracja multimodalna

Przetwarza dane wejściowe z:

języka naturalnego
obrazów
mowy/audio
wideo

z ujednoliconą reprezentacją tokenów dla wnioskowania między modalnościami.

Rozszerzone okno kontekstu

Wyjątkowo duża pojemność kontekstu, do ~1 miliona tokenów, umożliwia obsługę:

długich dokumentów
syntezy wielu dokumentów
baz kodu i transkryptów.

To przewyższa wiele konkurencyjnych modeli, które zazwyczaj obsługują ~32 K–262 K tokenów.

Skalowanie Sparse Mixture-of-Experts (MoE)

Routing Sparse MoE pozwala na skalowanie wewnętrznej pojemności modelu bez proporcjonalnych kosztów obliczeniowych, poprawiając wnioskowanie w skali.

Zaawansowane wnioskowanie / planowanie

Innowacje, takie jak trening łańcucha rozumowania (chain-of-thought), uczenie ze wzmocnieniem z informacją zwrotną od ludzi oraz wyspecjalizowane benchmarki, sprawiają, że model jest silny w zadaniach logicznych i matematycznych.

Domniemane benchmarki:

AIME 2025: 100% (z wykonywaniem kodu)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%

Reprezentatywne zastosowania korporacyjne

Potoki multimedialne end-to-end: Pobieranie wideo, transkryptów i obrazów w celu tworzenia zsynchronizowanych podsumowań, metadanych i ustrukturyzowanych wniosków na dużą skalę.
Generowanie i przegląd kodu na dużą skalę: Wykorzystanie w IDE i potokach CI do automatycznego generowania kodu, refaktoryzacji projektów wieloplikowych oraz proponowania testów w dużych bazach kodu.
Automatyzacja agentowa: Koordynacja wielonarzędziowych agentów, którzy wchodzą w interakcję z usługami chmurowymi, systemami orkiestracji i wewnętrznymi interfejsami API, wykorzystując strukturyzowane wywołania funkcji.
Badania i tworzenie treści: Tworzenie długich form (raporty, książki), łączących tekst i osadzone multimedia z zachowaniem wewnętrznych odnośników.

Jak uzyskać dostęp do interfejsu API Gemini 3.1 Pro

Krok 1: Zarejestruj się, aby uzyskać klucz API

Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj klucz API jako dane dostępu do interfejsu. Kliknij “Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i prześlij.

Krok 2: Wyślij zapytania do interfejsu API Gemini 3.1 Pro

Wybierz endpoint “gemini-3.1-pro”, aby wysłać żądanie API i ustaw body żądania. Metodę żądania i body żądania znajdziesz w naszej dokumentacji API na stronie. Nasza witryna zapewnia również testy Apifox dla Twojej wygody. Zamień <YOUR_API_KEY> na rzeczywisty klucz CometAPI z Twojego konta. base url is Gemini Generating Content and Chat.

Wstaw swoje pytanie lub prośbę do pola content — na to model odpowie. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.

Krok 3: Pobierz i zweryfikuj wyniki

Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania i dane wyjściowe.

Zobacz też Gemini 3 Pro API