Especificaciones técnicas de Qwen3.5-397B-A17B

Elemento	Qwen3.5-397B-A17B (posentrenado de pesos abiertos)
Familia del modelo	Qwen3.5 (serie Tongyi Qwen, Alibaba)
Arquitectura	Mezcla híbrida de expertos (MoE) + Gated DeltaNet; entrenamiento multimodal de fusión temprana
Parámetros totales	~397 mil millones (total)
Parámetros activos (A17B)	~17 mil millones activos por token (enrutamiento disperso)
Tipos de entrada	Texto, imagen, video (fusión temprana multimodal)
Tipos de salida	Texto (chat, código, salidas RAG), imagen a texto, respuestas multimodales
Ventana de contexto nativa	262,144 tokens (ISL nativo)
Contexto ampliable	Hasta ~1,010,000 tokens mediante escalado YaRN/ RoPE (dependiente de la plataforma)
Tokens máximos de salida	Dependiente del framework/servidor (las guías muestran 81,920–131,072)
Idiomas	Más de 200 idiomas y dialectos
Fecha de lanzamiento	16 de febrero de 2026 (lanzamiento de pesos abiertos)
Licencia	Apache‑2.0 (pesos abiertos en Hugging Face / ModelScope)

Qué es Qwen3.5-397B-A17B

Qwen3.5-397B-A17B es el primer lanzamiento de pesos abiertos en la familia Qwen3.5 de Alibaba: un gran modelo base multimodal de mezcla de expertos entrenado con objetivos de fusión temprana visión‑lenguaje y optimizado para flujos de trabajo agénticos. El modelo expone la capacidad completa de una arquitectura de 397 mil millones de parámetros mientras usa enrutamiento disperso (el sufijo “A17B”) para que solo ~17 mil millones de parámetros estén activos por token, proporcionando un equilibrio entre capacidad de conocimiento y eficiencia de inferencia.

Este lanzamiento está dirigido a investigadores y equipos de ingeniería que necesitan un modelo base multimodal, abierto y desplegable, capaz de razonamiento de largo contexto, comprensión visual y aplicaciones con recuperación aumentada/agénticas.

Características principales de Qwen3.5-397B-A17B

MoE disperso con eficiencia de parámetros activos: Gran capacidad global (397B) con actividad por token comparable a un modelo denso de 17B, reduciendo los FLOPS por token al tiempo que preserva la diversidad de conocimiento.
Multimodalidad nativa (fusión temprana): Entrenado para manejar texto, imágenes y video mediante una estrategia unificada de tokenización y codificador para razonamiento intermodal.
Soporte de contexto muy largo: Longitud nativa de secuencia de entrada de 262K tokens y vías documentadas para ampliar hasta ~1M+ tokens usando escalado RoPE/YARN para recuperación y canalizaciones de documentos largos.
Modo de pensamiento y herramientas de agente: Compatibilidad con trazas internas de razonamiento y un patrón de ejecución agéntico; ejemplos incluyen habilitar llamadas a herramientas e integración con intérprete de código.
Pesos abiertos y amplia compatibilidad: Publicado bajo Apache‑2.0 en Hugging Face y ModelScope, con guías de integración de primera parte para Transformers, vLLM, SGLang y frameworks de la comunidad.
Cobertura lingüística apta para empresas: Entrenamiento multilingüe extenso (más de 200 idiomas), además de instrucciones y guías para el despliegue a escala.

Qwen3.5-397B-A17B frente a modelos seleccionados

Modelo	Ventana de contexto (nativa)	Fortalezas	Compensaciones típicas
Qwen3.5-397B-A17B	262K (nativa)	MoE multimodal, pesos abiertos, capacidad de 397B con 17B activos	Artefactos de modelo grandes, requiere alojamiento distribuido para rendimiento completo
GPT-5.2 (cerrado representativo)	~400K (reportado para algunas variantes)	Alta precisión de razonamiento denso en un único modelo	Pesos cerrados, mayor costo de inferencia a escala
Denso estilo LLaMA 70B	~128K (varía)	Pila de inferencia más simple, menor VRAM para runtimes densos	Menor capacidad de parámetros relativa al conocimiento global de MoE

Limitaciones conocidas y consideraciones operativas

Huella de memoria: El MoE disperso sigue requiriendo almacenar archivos de pesos grandes; el alojamiento demanda almacenamiento y memoria de dispositivo significativos en comparación con un clon denso de 17B.
Complejidad de ingeniería: El rendimiento óptimo requiere paralelismo cuidadoso (tensor/pipeline) y frameworks como vLLM o SGLang; el alojamiento simple en una sola GPU es impráctico.
Economía de tokens: Aunque el cómputo por token se reduce, los contextos muy largos aún incrementan el I/O, el tamaño de la caché KV y la facturación en proveedores gestionados.
Seguridad y salvaguardas: Los pesos abiertos aumentan la flexibilidad pero trasladan la responsabilidad de los filtros de seguridad, la monitorización y las barreras de despliegue al operador.

Casos de uso representativos

Investigación y análisis de modelos: Los pesos abiertos permiten investigación reproducible y evaluación impulsada por la comunidad.
Servicios multimodales on-premise: Las empresas que necesitan residencia de datos pueden desplegar y ejecutar cargas de trabajo de visión + texto localmente.
RAG y canalizaciones de documentos largos: El soporte nativo de contexto largo facilita el razonamiento de pasada única sobre grandes corpus.
Inteligencia de código y herramientas de agente: Analizar monorepos, generar parches y ejecutar bucles de llamadas a herramientas agénticos en entornos controlados.
Aplicaciones multilingües: Soporte lingüístico de amplia cobertura para productos globales.

Cómo acceder e integrar Qwen3.5-397B-A17B

Paso 1: Regístrate para obtener la clave de API

Inicia sesión en cometapi.com. Si aún no eres usuario, regístrate primero. Entra en tu Consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de API del centro personal, obtén la clave del token: sk-xxxxx y envíala.

Paso 2: Envía solicitudes a la API de Qwen3.5-397B-A17B

Selecciona el endpoint “Qwen3.5-397B-A17B” para enviar la solicitud de API y establecer el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de API de nuestro sitio web. Nuestro sitio también proporciona pruebas en Apifox para tu conveniencia. Reemplaza <YOUR_API_KEY> con tu clave real de CometAPI de tu cuenta. Dónde invocarlo: Chat formato.

Inserta tu pregunta o solicitud en el campo content—esto es a lo que responderá el modelo. Procesa la respuesta de la API para obtener la respuesta generada.

Paso 3: Recupera y verifica los resultados

Procesa la respuesta de la API para obtener la respuesta generada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.

qwen3.5-397b-a17b

Especificaciones técnicas de Qwen3.5-397B-A17B

Qué es Qwen3.5-397B-A17B

Características principales de Qwen3.5-397B-A17B

Qwen3.5-397B-A17B frente a modelos seleccionados

Limitaciones conocidas y consideraciones operativas

Casos de uso representativos

Cómo acceder e integrar Qwen3.5-397B-A17B

Paso 1: Regístrate para obtener la clave de API

Paso 2: Envía solicitudes a la API de Qwen3.5-397B-A17B

Paso 3: Recupera y verifica los resultados

Preguntas Frecuentes

Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

What is the native context window and can I extend it for very long documents?

Which input modalities does Qwen3.5-397B-A17B support?

How does inference efficiency compare to a 17B dense model?

Características para qwen3.5-397b-a17b

Precios para qwen3.5-397b-a17b

Código de ejemplo y API para qwen3.5-397b-a17b

Más modelos