le 29 avril 2025 — Alibaba Group a lancé Qwen 3, la dernière itération de son modèle phare d'intelligence artificielle, introduisant des capacités de raisonnement hybride avancées conçues pour améliorer l'adaptabilité et l'efficacité des développeurs créant des applications et des logiciels.
Les modèles Qwen3 sont accessibles (ou bientôt disponibles) en téléchargement sous licence libre sur des plateformes telles que Hugging Face et GitHub. Leur taille varie de 0.6 milliard à 235 milliards de paramètres, les modèles les plus volumineux affichant généralement de meilleures capacités de résolution de problèmes grâce à leurs jeux de paramètres étendus.
Principales caractéristiques et avantages de Qwen 3
Qwen3 prend en charge 119 langues et a été entraîné sur un vaste ensemble de données contenant environ 36 1 milliards de jetons. Les jetons représentent les unités de données de base traitées par les modèles ; généralement, 750,000 million de jetons équivaut à environ XNUMX XNUMX mots. Le matériel de formation comprenait des manuels, des paires de questions-réponses, des extraits de code et des données générées par l'IA.
Comparé à son prédécesseur, le Qwen2, le Qwen3 affiche des performances considérablement améliorées. Bien que les modèles Qwen3 ne surpassent pas les modèles haut de gamme comme les o3 et o4-mini d'OpenAI, ils offrent néanmoins des performances compétitives.
Plus précisément, le plus grand modèle Qwen3, Qwen-3-235B-A22B, se distingue de l'o3-mini d'OpenAI et du Gemini 2.5 Pro de Google sur des plateformes comme Codeforces, réputées pour leurs concours de programmation. Ce modèle surpasse également les tests mathématiques complexes comme AIME et BFCL. Cependant, Qwen-3-235B-A22B n'a pas encore été mis à disposition du public.

Le modèle Qwen3 le plus volumineux et accessible au public, Qwen3-32B, reste compétitif face à divers modèles d'IA propriétaires et ouverts, surpassant le o1 d'OpenAI dans plusieurs tests, dont le benchmark de codage LiveCodeBench. Alibaba affirme que Qwen3 « excelle » dans ses capacités d'appel d'outils, suit efficacement les instructions et reproduit des formats de données spécifiques. Qwen3 est également accessible via des fournisseurs cloud comme Fireworks AI et Hyperbolic.
Alibaba qualifie les modèles Qwen3 d'« hybrides », ce qui témoigne de leur capacité à s'engager dans un raisonnement approfondi pour résoudre des problèmes complexes ou à traiter rapidement des requêtes plus simples. Cette capacité de raisonnement polyvalente, similaire à celle des modèles o3 d'OpenAI, leur permet de s'auto-vérifier, mais avec une latence accrue.
Contexte stratégique
La sortie de Qwen 3 intervient dans un contexte de concurrence accrue dans le secteur chinois de l'IA, stimulée par le succès retentissant de la startup locale DeepSeek en début d'année. Les modèles d'IA performants et économiques de DeepSeek ont incité des acteurs majeurs comme Baidu à intensifier leurs efforts en la matière, dévoilant des modèles avancés tels que l'Ernie 4.5 Turbo et l'Ernie X1 Turbo, optimisé pour le raisonnement.
Qwen 3 d'Alibaba poursuit sa rivalité avec DeepSeek, après avoir lancé Qwen 2.5-Max peu après la percée de DeepSeek. Cette innovation rapide souligne l'intensification de la course aux armements en matière d'IA entre les géants technologiques chinois.
Implications mondiales de Qwen 3
La série Qwen d'Alibaba a joué un rôle déterminant dans le virage stratégique de l'entreprise vers l'IA, une initiative qui a revitalisé l'entreprise après les défis réglementaires et les pressions du marché de ces dernières années. Sous la direction de son PDG Eddie Wu, Alibaba a consolidé sa vision de l'IA, en réaffectant ses ressources et en cédant des actifs non stratégiques pour se concentrer sur le développement de l'IA.
Le lancement de Qwen 3 témoigne non seulement de l'engagement d'Alibaba en faveur de l'innovation en matière d'IA, mais illustre également la tendance générale des géants technologiques chinois à se disputer la domination du secteur de l'IA. Alors que l'IA devient de plus en plus essentielle à divers secteurs, les évolutions du paysage chinois de l'IA sont appelées à avoir des répercussions mondiales.
Pour commencer
Les développeurs peuvent accéder Qwen 3 API via API CometPour commencer, explorez les capacités du modèle dans le Playground et consultez le Guide de l'API Pour des instructions détaillées, veuillez noter que certains développeurs devront peut-être vérifier leur organisation avant d'utiliser le modèle.
