Specyfikacje techniczne — Gemini 3.1 Pro
| Pozycja | gemini-3-pro (public summary) |
|---|---|
| Dostawca | |
| Kanoniczny identyfikator modelu | gemini-3-pro (public preview) |
| Typy wejścia | Text, Image, Video, Audio, PDF |
| Typy wyjścia | Text (natural language, structured outputs, function-call payloads) |
| Limit tokenów wejściowych (kontekst) | 1,048,576 tokens |
| Limit tokenów wyjściowych | 65,536 tokens |
| Wywoływanie funkcji / użycie narzędzi | Supported (function calling, structured outputs, tool integrations) |
| Multimodalność | Full multimodal support (images, video, audio, documents) |
| Wykonywanie kodu i przepływy agentowe | Supported (agent mode, code assist, tool orchestration) |
| Data odcięcia wiedzy | January 2025 |
Czym jest Gemini 3.1 Pro?
Gemini 3.1 Pro to flagowy, publicznie dostępny model Google z rodziny Gemini 3, pozycjonowany jako najnowocześniejszy multimodalny model rozumowania z zaawansowanymi narzędziami agentowymi i deweloperskimi. Model kładzie nacisk na obsługę kontekstu o dużej pojemności (ponad 1M tokenów wejściowych), szerokie wsparcie mediów (obrazy, wideo, audio, PDF) oraz głębokie integracje do użycia narzędzi, wywoływania funkcji i przepływów zorientowanych na kod (np. Gemini Code Assist i tryby agenta).
Gemini 3 Pro jest przedstawiany przez Google jako zoptymalizowany zarówno pod kątem interaktywnych doświadczeń deweloperskich (kodowanie o niskich opóźnieniach i przepływy agentowe), jak i wysokiej wierności rozumienia multimodalnego (interpretacja i wnioskowanie na podstawie zróżnicowanych danych wejściowych).
Główne funkcje Gemini 3.1 Pro
Gemini-3.1 Pro (w wersji Preview) wprowadza następujące funkcje:
Integracja multimodalna
Przetwarza dane wejściowe z:
- języka naturalnego
- obrazów
- mowy/audio
- wideo
z ujednoliconą reprezentacją tokenów dla wnioskowania między modalnościami.
Rozszerzone okno kontekstu
Wyjątkowo duża pojemność kontekstu, do ~1 miliona tokenów, umożliwia obsługę:
- długich dokumentów
- syntezy wielu dokumentów
- baz kodu i transkryptów.
To przewyższa wiele konkurencyjnych modeli, które zazwyczaj obsługują ~32 K–262 K tokenów.
Skalowanie Sparse Mixture-of-Experts (MoE)
Routing Sparse MoE pozwala na skalowanie wewnętrznej pojemności modelu bez proporcjonalnych kosztów obliczeniowych, poprawiając wnioskowanie w skali.
Zaawansowane wnioskowanie / planowanie
Innowacje, takie jak trening łańcucha rozumowania (chain-of-thought), uczenie ze wzmocnieniem z informacją zwrotną od ludzi oraz wyspecjalizowane benchmarki, sprawiają, że model jest silny w zadaniach logicznych i matematycznych.
Domniemane benchmarki:
AIME 2025: 100% (z wykonywaniem kodu)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
Reprezentatywne zastosowania korporacyjne
- Potoki multimedialne end-to-end: Pobieranie wideo, transkryptów i obrazów w celu tworzenia zsynchronizowanych podsumowań, metadanych i ustrukturyzowanych wniosków na dużą skalę.
- Generowanie i przegląd kodu na dużą skalę: Wykorzystanie w IDE i potokach CI do automatycznego generowania kodu, refaktoryzacji projektów wieloplikowych oraz proponowania testów w dużych bazach kodu.
- Automatyzacja agentowa: Koordynacja wielonarzędziowych agentów, którzy wchodzą w interakcję z usługami chmurowymi, systemami orkiestracji i wewnętrznymi interfejsami API, wykorzystując strukturyzowane wywołania funkcji.
- Badania i tworzenie treści: Tworzenie długich form (raporty, książki), łączących tekst i osadzone multimedia z zachowaniem wewnętrznych odnośników.
Jak uzyskać dostęp do interfejsu API Gemini 3.1 Pro
Krok 1: Zarejestruj się, aby uzyskać klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj klucz API jako dane dostępu do interfejsu. Kliknij “Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i prześlij.
Krok 2: Wyślij zapytania do interfejsu API Gemini 3.1 Pro
Wybierz endpoint “gemini-3.1-pro”, aby wysłać żądanie API i ustaw body żądania. Metodę żądania i body żądania znajdziesz w naszej dokumentacji API na stronie. Nasza witryna zapewnia również testy Apifox dla Twojej wygody. Zamień <YOUR_API_KEY> na rzeczywisty klucz CometAPI z Twojego konta. base url is Gemini Generating Content and Chat.
Wstaw swoje pytanie lub prośbę do pola content — na to model odpowie. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania i dane wyjściowe.
Zobacz też Gemini 3 Pro API