29 kwietnia 2025 r. — Alibaba Group wprowadziła na rynek Qwen 3, najnowszą wersję swojego flagowego modelu sztucznej inteligencji, wprowadzającą zaawansowane możliwości hybrydowego rozumowania mające na celu zwiększenie adaptowalności i wydajności dla programistów tworzących aplikacje i oprogramowanie.
Modele Qwen3 są dostępne (lub wkrótce dostępne) do pobrania na podstawie otwartej licencji na platformach takich jak Hugging Face i GitHub. Rozmiar tych modeli waha się od 0.6 miliarda do 235 miliardów parametrów, przy czym większe modele zazwyczaj wykazują lepsze zdolności rozwiązywania problemów ze względu na ich rozbudowane zestawy parametrów.
Główne cechy i zalety Qwen 3
Qwen3 obsługuje 119 języków i został wytrenowany na rozległym zestawie danych zawierającym około 36 bilionów tokenów. Tokeny reprezentują podstawowe jednostki danych przetwarzane przez modele; zazwyczaj 1 milion tokenów odpowiada około 750,000 XNUMX słów. Materiały szkoleniowe obejmowały podręczniki, pary pytań i odpowiedzi, fragmenty kodu i dane generowane przez sztuczną inteligencję.
W porównaniu do swojego poprzednika Qwen2, Qwen3 wykazuje znacznie zwiększoną wydajność. Chociaż modele Qwen3 mogą nie przewyższać uniwersalnie najlepszych modeli, takich jak o3 i o4-mini firmy OpenAI, nadal zapewniają konkurencyjne możliwości.
Konkretnie, największy model Qwen3, Qwen-3-235B-A22B, wykazuje wyższość nad o3-mini OpenAI i Gemini 2.5 Pro Google na platformach takich jak Codeforces, znanych z konkursów programistycznych. Model ten przewyższa również złożone oceny matematyczne, takie jak AIME i BFCL. Jednakże Qwen-3-235B-A22B nie został jeszcze wydany do użytku publicznego.

Największy publicznie dostępny model Qwen3, Qwen3-32B, pozostaje konkurencyjny w stosunku do wielu zastrzeżonych i otwartych modeli AI, przewyższając o1 OpenAI w kilku testach, w tym w benchmarku kodowania LiveCodeBench. Alibaba twierdzi, że Qwen3 „wyróżnia się” w zakresie możliwości wywoływania narzędzi i skutecznie przestrzega instrukcji oraz replikuje określone formaty danych. Qwen3 jest również dostępny za pośrednictwem dostawców chmury, takich jak Fireworks AI i Hyperbolic.
Alibaba opisuje modele Qwen3 jako „hybrydowe”, wskazując na ich zdolność do angażowania się w głębokie rozumowanie w przypadku złożonych problemów lub szybkiego radzenia sobie z prostszymi żądaniami. Ta wszechstronna zdolność rozumowania, podobna do modeli o3 OpenAI, pozwala im na samodzielną weryfikację faktów, choć ze zwiększonym opóźnieniem.
Kontekst strategiczny
Wydanie Qwen 3 nastąpiło w trakcie zaostrzonej konkurencji w chińskim sektorze AI, pobudzonej przez przełomowy sukces lokalnego startupu DeepSeek na początku tego roku. Wysokowydajne, ekonomiczne modele AI firmy DeepSeek skłoniły głównych graczy, takich jak Baidu, do zintensyfikowania działań w zakresie AI, prezentując zaawansowane modele, takie jak Ernie 4.5 Turbo i zoptymalizowany pod kątem rozumowania Ernie X1 Turbo.
Alibaba Qwen 3 kontynuuje rywalizację z DeepSeek, wcześniej wprowadzając Qwen 2.5-Max krótko po przełomie DeepSeek. Szybka innowacja podkreśla nasilającą się rywalizację w zakresie AI między chińskimi gigantami technologicznymi.
Globalne implikacje Qwen 3
Seria Qwen firmy Alibaba odegrała kluczową rolę w strategicznym zwrocie firmy w kierunku AI, ruchu, który ożywił firmę po wyzwaniach regulacyjnych i presji rynku w ostatnich latach. Pod przewodnictwem CEO Eddiego Wu firma Alibaba skonsolidowała swoją wizję AI, realokując zasoby i sprzedając aktywa niestrategiczne, aby skupić się na rozwoju AI.
Wprowadzenie Qwen 3 nie tylko oznacza zaangażowanie Alibaby w innowacje AI, ale także podkreśla szerszy trend chińskich gigantów technologicznych rywalizujących o dominację w sektorze AI. W miarę jak AI staje się coraz bardziej integralną częścią różnych branż, zmiany w chińskim krajobrazie AI są gotowe, aby mieć globalne implikacje.
Jak zacząć
Deweloperzy mogą uzyskać dostęp Qwen3 API poprzez Interfejs API CometNa początek zapoznaj się z możliwościami modelu w Playground i skonsultuj się z Przewodnik po API aby uzyskać szczegółowe instrukcje. Należy pamiętać, że niektórzy deweloperzy mogą potrzebować zweryfikować swoją organizację przed użyciem modelu.
