Specyfikacje techniczne — Gemini 3.1 Pro
| Pozycja | gemini-3-pro (publiczne podsumowanie) |
|---|---|
| Dostawca | |
| Kanoniczny identyfikator modelu | gemini-3-pro (public preview) |
| Typy wejścia | Tekst, obraz, wideo, audio, PDF |
| Typy wyjścia | Tekst (język naturalny, wyjścia ustrukturyzowane, ładunki function-call) |
| Limit tokenów wejściowych (kontekst) | 1,048,576 tokenów |
| Limit tokenów wyjściowych | 65,536 tokenów |
| Wywoływanie funkcji / użycie narzędzi | Obsługiwane (function calling, wyjścia ustrukturyzowane, integracje narzędzi) |
| Multimodalność | Pełna obsługa multimodalna (obrazy, wideo, audio, dokumenty) |
| Wykonywanie kodu i przepływy agentowe | Obsługiwane (tryb agenta, code assist, orkiestracja narzędzi) |
| Granica wiedzy | Styczeń 2025 |
Czym jest Gemini 3.1 Pro?
Gemini 3.1 Pro to publicznie dostępowy flagowy model Google z rodziny Gemini 3, pozycjonowany jako nowoczesny multimodalny model rozumowania z zaawansowanymi narzędziami agentowymi i deweloperskimi. Model kładzie nacisk na obsługę kontekstu o bardzo dużej pojemności (ponad 1 mln tokenów wejściowych), szerokie wsparcie dla mediów (obrazy, wideo, audio, PDF) oraz głębokie integracje do użycia narzędzi, wywoływania funkcji i przepływów pracy skoncentrowanych na kodzie (np. Gemini Code Assist i tryby agenta).
Google przedstawia Gemini 3 Pro jako model zoptymalizowany zarówno pod kątem interaktywnych doświadczeń deweloperskich (kodowanie o niskich opóźnieniach i przepływy agentowe), jak i wysokiej jakości rozumienia multimodalnego (interpretowanie i wnioskowanie na podstawie mieszanych danych wejściowych).
Główne funkcje Gemini 3.1 Pro
Gemini-3.1 Pro (w wersji Preview) wprowadza następujące funkcje:
Integracja multimodalna
Przetwarza dane wejściowe obejmujące:
- Język naturalny
- Obrazy
- Mowę/audio
- Wideo
z użyciem ujednoliconej reprezentacji tokenów do wnioskowania między modalnościami.
Rozszerzone okno kontekstowe
Wyjątkowo duża pojemność kontekstu do ~1 miliona tokenów umożliwia obsługę:
- Długich dokumentów
- Syntezy wielu dokumentów
- Baz kodu i transkrypcji.
Przewyższa to wiele konkurencyjnych modeli, które zwykle obsługują ~32 K–262 K tokenów.
Skalowanie Sparse Mixture-of-Experts (MoE)
Rzadkie trasowanie MoE umożliwia skalowanie wewnętrznej pojemności modelu bez proporcjonalnego wzrostu kosztów obliczeniowych, poprawiając rozumowanie w dużej skali.
Zaawansowane rozumowanie / planowanie
Innowacje takie jak trening chain-of-thought, uczenie przez wzmacnianie z informacją zwrotną od ludzi oraz wyspecjalizowane benchmarki sprawiają, że model jest mocny w zadaniach logicznych i matematycznych.
Deklarowane benchmarki:
AIME 2025: 100% (z wykonywaniem kodu)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
Reprezentatywne zastosowania biznesowe
- Kompleksowe pipeline’y medialne: Pobieranie wideo, transkrypcji i obrazów w celu tworzenia zsynchronizowanych podsumowań, metadanych i ustrukturyzowanych wniosków na dużą skalę.
- Generowanie i przegląd kodu na dużą skalę: Użycie w IDE i pipeline’ach CI do automatycznego generowania kodu, refaktoryzacji projektów wieloplikowych i tworzenia sugestii testów w dużych bazach kodu.
- Automatyzacja agentowa: Koordynowanie agentów wielonarzędziowych, które wchodzą w interakcje z usługami chmurowymi, systemami orkiestracji i wewnętrznymi API przy użyciu ustrukturyzowanych wywołań funkcji.
- Badania i tworzenie treści: Opracowywanie długich treści (raportów, książek), które łączą tekst i osadzone multimedia z zachowaniem wewnętrznych odwołań krzyżowych.
Jak uzyskać dostęp do API Gemini 3.1 Pro
Krok 1: Zarejestruj się, aby uzyskać klucz API
Zaloguj się do cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu, czyli klucz API interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, uzyskaj klucz tokena: sk-xxxxx i zatwierdź.
Krok 2: Wysyłaj żądania do API Gemini 3.1 Pro
Wybierz endpoint „gemini-3.1-pro”, aby wysłać żądanie API, i ustaw treść żądania. Metoda żądania i treść żądania są dostępne w dokumentacji API na naszej stronie. Nasza strona internetowa udostępnia również testy Apifox dla Twojej wygody. Zastąp <YOUR_API_KEY> swoim rzeczywistym kluczem CometAPI z konta. Base URL to Gemini Generating Content oraz Chat.
Wstaw swoje pytanie lub żądanie do pola content — na to model odpowie. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania i dane wyjściowe.
Zobacz także Gemini 3 Pro API