Alibaba, 에이전트 AI 코딩의 혁신, Qwen3‑Coder 및 Qwen Code 출시

23년 2025월 3일, 알리바바 그룹은 소프트웨어 개발 및 자율 코딩 작업에 특화된 오픈소스 인공지능 모델인 Qwen3‑Coder를 공식 출시했습니다. 이번 발표를 통해 QwenXNUMX‑Coder는 알리바바 역사상 가장 진보된 코딩 모델로 자리매김했으며, 현대 소프트웨어 엔지니어링 팀의 복잡한 요구를 충족하도록 설계된 전례 없는 규모와 성능을 자랑합니다.

주력 변형, Qwen3‑Coder‑480B‑A35B‑Instruct는 480억 개의 활성 매개변수를 포함하는 35억 개의 매개변수를 가진 MoE 모델로 구성되어 있으며, 기본적으로 최대 256개의 토큰까지 컨텍스트 윈도우를 지원하고 외삽 기법을 통해 1만 개의 토큰까지 확장할 수 있습니다. 이처럼 광범위한 컨텍스트 길이 덕분에 모델은 대규모 코드베이스, 문서 및 다중 파일 프로젝트에서 종속성을 추적하지 않고 일관성을 유지할 수 있습니다.

Qwen3‑Coder의 모델 사양 및 기능

주요 기술적 특징은 다음과 같습니다.

광범위한 벤치마크: Alibaba에 따르면, Qwen3‑Coder는 SWE‑Bench‑Verified 및 에이전트 코딩 평가와 같은 벤치마크에서 기존의 모든 오픈 소스 코딩 모델보다 우수한 성능을 보이며, 뛰어난 정확성, 효율성 및 코드 품질을 입증했습니다.

에이전트 코딩 프레임워크: Qwen3‑Coder는 장기적 강화 학습(Agent RL)을 활용하여 코딩 작업을 자율적으로 계획하고, 외부 개발자 도구를 호출하고, 피드백 루프를 기반으로 자체 수정하여 실제 소프트웨어 엔지니어링 프로세스를 반영할 수 있습니다.

이중 사고 모드: 통합된 사고 및 비사고 모드를 통해 모델은 계산 예산을 동적으로 조정하여 간단한 스크립트에 대한 빠른 대응과 복잡한 알고리즘 과제에 대한 심층적 추론 사이를 전환할 수 있습니다.

성능 벤치 마크

내부 벤치마크에서 Qwen3‑Coder는 코드 생성 정확도 및 다중 파일 디버깅과 같은 주요 코딩 지표에서 DeepSeek 및 Moonshot AI의 K2를 포함한 국내 주요 경쟁사들을 능가했습니다. 더욱이 Alibaba는 표준 코딩 과제에서 OpenAI의 GPT‑4 및 Anthropic의 Claude와 같은 미국 최고 모델들과 동등한 성능을 보였다고 주장하며, 이는 Alibaba의 세계적인 경쟁력을 강조합니다.

모델	런타임 실패(%)	문법 오류(%)	0점률(%)	총 실패(%)	최대 점수	중간 점수	중간값 격차(%)
OpenAI o4 mini(높음)	1.11	3.33	6.67	11.11	77.75	66.75	14.16
클로드 소네트 4번 (생각하다)	1.11	5.56	3.33	10.00	75.67	66.98	11.49
큐웬3-코더-480B-A35B	5.56	4.44	10.00	20.00	72.85	52.04	28.57
제미니 2.5 프로	2.22	7.78	8.89	18.89	72.24	58.05	19.65
딥시크 R1 0528	3.33	5.56	13.33	22.22	69.36	49.25	29.00
클로드 소네트 4	3.33	4.44	7.78	15.55	68.26	61.02	10.60
GPT-4.1 미니	2.22	7.78	3.33	13.33	64.39	50.87	20.99
Qwen3-235B-A22B-Instruct-2507	4.44	16.67	13.33	34.44	63.24	42.44	32.89

대규모로 훈련됨 7.5조 개의 토큰 데이터 세트이상 70% 고품질 코드 저장소에서 얻은 데이터를 바탕으로, Qwen3-Coder는 실제 개발 시나리오를 기반으로 한 강화 학습을 통해 더욱 개선되었습니다. 이러한 학습 후 미세 조정을 통해 모델의 실행 성공률과 정확하고 효율적인 코드 생성의 견고성이 크게 향상되었습니다.

Qwen3-Coder는 이제 다음에서 사용 가능합니다. 포옹하는 얼굴 및 GitHub의, 개발자는 다음을 통해 액세스할 수 있습니다. 알리바바 클라우드 모델 스튜디오 API. 또한 통합되었습니다. **통이 링마(Qwen Code)**알리바바의 AI 코딩 어시스턴트는 기업과 개인 개발자 모두에게 원활한 배포를 제공합니다.

웬 코드

광범위한 채택을 촉진하기 위해 Alibaba는 동시에 출시합니다. 웬 코드Gemini Cli를 기반으로 구축된 명령줄 인터페이스로, Qwen3‑Coder를 널리 사용되는 개발 환경, 버전 제어 시스템 및 CI/CD 파이프라인에 원활하게 연결합니다. 이 도구의 기능은 다음과 같습니다.

사용자 정의 프롬프트 및 함수 호출: 개발자가 테스트 생성, 코드 검토, 배포 작업을 수행할 수 있도록 안내하는 미리 구성된 상호작용 패턴입니다.
플러그인 아키텍처: 타사 디버거, 린터, 성능 프로파일러를 통합하기 위한 확장 가능한 모듈입니다.
알리바바 클라우드 모델 스튜디오 접속: Alibaba Cloud 생태계 내에서 원클릭 API 프로비저닝, 모니터링 대시보드 및 미세 조정 옵션을 제공합니다.

개발자는 npm 관리자를 통해 Qwen Code를 설치하거나 GitHub의 소스 코드를 사용할 수 있습니다. Qwen Code는 LLM을 호출하는 OpenAI SDK를 지원합니다.

시작 가이드

CometAPI는 OpenAI의 GPT 시리즈, Google의 Gemini, Anthropic의 Claude, Midjourney, Suno 등 주요 공급업체의 500개 이상의 AI 모델을 단일 개발자 친화적인 인터페이스로 통합하는 통합 API 플랫폼입니다. CometAPI는 일관된 인증, 요청 형식 지정 및 응답 처리를 제공하여 애플리케이션에 AI 기능을 통합하는 과정을 획기적으로 간소화합니다. 챗봇, 이미지 생성기, 음악 작곡가 또는 데이터 기반 분석 파이프라인 등 어떤 제품을 구축하든 CometAPI를 사용하면 AI 생태계 전반의 최신 혁신 기술을 활용하면서 반복 작업을 더 빠르게 수행하고 비용을 관리하며 공급업체에 구애받지 않을 수 있습니다.

개발자는 다음과 상호 작용할 수 있습니다. Qwen3-코더 CometAPI를 통해 사용 가능한 호환 가능한 OpenAI 스타일 API를 통해. 코멧API오픈 소스를 제공하는(qwen3-coder-480b-a35b-instruct) 및 상업용 버전(qwen3-coder-plus; qwen3-coder-plus-2025-07-22) 동일한 가격으로 제공됩니다. 상용 버전은 1M 길이입니다. Python용 샘플 코드(OpenAI 호환 클라이언트 사용)에는 샘플링 설정(temperature = 0.7, top_p = 0.8, top_k = 20, repetition_penalty = 1.05)을 권장하는 모범 사례가 포함되어 있습니다. 출력 길이는 최대 65,536개의 토큰까지 확장할 수 있어 대규모 코드 생성 작업에 적합합니다.

시작하려면 모델의 기능을 탐색하세요. 운동장 그리고 상담하십시오 API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요.

Qwen3‑Coder의 모델 사양 및 기능

성능 벤치 마크

웬 코드

시작 가이드

더 보기

하나의 API로 500개 이상의 모델