Google wprowadza na rynek nowy model Gemini 2.5 Flash-Lite

CometAPI
AnnaJun 17, 2025
Google wprowadza na rynek nowy model Gemini 2.5 Flash-Lite

Google DeepMind ogłosił dziś znaczące rozszerzenia swojej rodziny Gemini 2.5, prezentując stabilne wersje Gemini 2.5 Pro i Gemini 2.5 Flash wraz z podglądem zupełnie nowego modelu Gemini 2.5 Flash‑Lite. Te aktualizacje odzwierciedlają ciągłe zaangażowanie Google w oferowanie spektrum modeli AI, które równoważą koszty, szybkość i wydajność dla różnych obciążeń.

Stabilne wersje: Gemini 2.5 Pro i Flash

17 czerwca 2025 r. Google ogłosiło ogólną dostępność Gemini 2.5 Pro i Gemini 2.5 Flash. Wariant Pro zapewnia maksymalną moc rozumowania i jest dostosowany do zadań o wysokiej złożoności, takich jak zaawansowane generowanie kodu, analiza naukowa i synteza danych na dużą skalę. Natomiast Gemini 2.5 Flash oferuje opcję średniej klasy zoptymalizowaną do codziennych zastosowań wymagających niskiego opóźnienia — idealną do chatbotów, podsumowań i tworzenia treści na dużą skalę.

Przegląd: Trzy modele w rodzinie Gemini-2.5

ModelStatusSilne stronyIdealne przypadki użycia
Gemini 2.5 Flash‑Lite (zapowiedź)PodglądNajszybsze i najtańsze; multimodalne; kontrolowane rozumowanie; obsługiwane za pomocą narzędziZadania o dużej objętości, takie jak chatboty, podsumowania, wyszukiwanie
Gemini 2.5 FlashStabilnyZrównoważony: niskie opóźnienie, dobre rozumowanie, multimodalnyRozmowy w czasie rzeczywistym, obsługa klienta
Gemini 2.5 ProStabilnyNajbardziej zdolny: głębokie rozumowanie, ogromny kontekst, multimodalnośćBadania, złożone kodowanie, zadania naukowe

Google wprowadza na rynek nowy model Gemini 2.5 Flash-Lite

Gemini 2.5 Flash‑Lite: najważniejsze informacje o wersji zapoznawczej

Bardzo niskie opóźnienie i oszczędność kosztów:Zaprojektowany do aplikacji o dużej objętości i czasie rzeczywistym, takich jak tłumaczenie, klasyfikacja i podsumowywanie. Oferuje szybsze wnioskowanie i niższy koszt na wywołanie w porównaniu do wersji 2.0 Flash‑Lite i pełnej wersji Flash.

Poprawiona wydajność podstawowa:Wykazuje lepsze wyniki od wcześniejszych modeli Flash‑Lite w testach porównawczych w zakresie generowania kodu, logiki, matematyki, rozumowania multimodalnego i nauk ścisłych.

Koszt i wydajność:Ceny Flash‑Lite (wersja zapoznawcza): ~$0.10 za 1 mln tokenów wejściowych i ~$0.40 za 1 mln tokenów wyjściowych — znacznie taniej niż Flash ($0.30/$2.50) i Pro ($1.25/$10).

Pełne możliwości Gemini -2.5:

  • Myślenie kontrolowane:Użytkownicy mogą ustawić „budżety myślowe” (limity tokenów), aby wymienić prędkość na głębokość — Flash‑Lite może włączać tę opcję w razie potrzeby.
  • Wejście multimodalne:Obsługuje tekst, obrazy, dźwięk i wideo (w tym klipy godzinne), z możliwością analizowania wykresów, interfejsu użytkownika, scen i podsumowań zdarzeń.
  • Integracja narzędzi:Obejmuje wyszukiwarkę Google, wykonywanie kodu i okno kontekstowe z milionem tokenów, co odpowiada możliwościom Flash i Pro.

Pozycjonowanie na krzywej ceny i wydajności

Google pozycjonuje Flash‑Lite pod względem szybkości i niskich kosztów granica Pareta, co oznacza, że ​​jest to jeden z najbardziej ekonomicznych i wydajnych modeli na świecie (). W ocenach porównawczych, Flash‑Lite to najlepszy stosunek jakości do ceny:inteligentne i przystępne cenowo.


O Flashu i Pro

  • Gemini 2.5 Flash:Stabilny, nisko-latencyjny, multimodalny model myślenia. Pozycjonowany poniżej Pro, ale mniej więcej na równi z GPT-4o pod względem możliwości, z lepszą prędkością i efektywnością kosztową ().
  • Gemini 2.5 Pro: Najbardziej zaawansowany model Google. Znany z obsługi wielogodzinnych nagrań wideo/audio, złożonego kodu i matematyki oraz rozumowania w szerokim kontekście. Wprowadza również selektywne „budżety myślowe” i ulepszoną jakość kodu, aby służyć jako długoterminowa stabilna sztandarowa sztuczna inteligencja.

Wdrożenie i cennik

  • Dostępność: :Do wszystkich trzech modeli można uzyskać dostęp za pośrednictwem Studio sztucznej inteligencji Google, Sztuczna inteligencja Google Cloud Vertexi Aplikacja Bliźnięta .
  • Struktura kosztów (Cennik Vertex AI od 16 czerwca 2025 r.):
  • Pro: $1.25/1 mln wejścia, $10/1 mln wyjścia (wyższe powyżej 200 tys. tokenów)
  • Migać: $0.15/1 mln wejść, $3.50/1 mln wyjść w trybie „myślenia” — i obejmuje 1,500 bezpłatnych, uziemionych monitów dziennie ()
  • Lampa błyskowa (podgląd): ~$0.10/$0.40 za 1 mln tokenów

Jak zacząć

CometAPI zapewnia ujednolicony interfejs REST, który agreguje setki modeli AI — w ramach spójnego punktu końcowego, z wbudowanym zarządzaniem kluczami API, limitami wykorzystania i panelami rozliczeniowymi. Zamiast żonglować wieloma adresami URL dostawców i poświadczeniami.

Deweloperzy mogą uzyskać dostęp Gemini 2.5 Flash-Lite (wersja zapoznawcza) API przez Interfejs API Comet, najnowsze wymienione modele są z dnia publikacji artykułu. Na początek zapoznaj się z możliwościami modelu w Plac zabaw i zapoznaj się z Przewodnik po API aby uzyskać szczegółowe instrukcje. Przed uzyskaniem dostępu upewnij się, że zalogowałeś się do CometAPI i uzyskałeś klucz API. Interfejs API Comet zaoferuj cenę znacznie niższą niż oficjalna, aby ułatwić Ci integrację.

Czytaj więcej

500+ modeli w jednym API

Do 20% zniżki