퀀 3 API

CometAPI
AnnaApr 29, 2025
퀀 3 API

Qwen 3 API는 Alibaba Cloud에서 개발한 OpenAI 호환 인터페이스로, 개발자가 밀집형 및 전문가 혼합(MoE) 아키텍처에서 모두 사용 가능한 고급 Qwen 3 대규모 언어 모델을 애플리케이션에 통합하여 텍스트 생성, 추론, 다국어 지원 등의 작업을 수행할 수 있도록 합니다.


Qwen 3 개요

주요 특징

  • 하이브리드 추론 기능: Qwen 3은 기존의 AI 기능과 고급 동적 추론 기능을 모두 통합하여 개발자의 적응성과 효율성을 향상시킵니다.
  • 확장성: 모델 패밀리에는 밀집 모델(0.6B~32B 매개변수)과 희소 모델(30B 활성화 매개변수가 있는 3B, 235B 활성화 매개변수가 있는 22B)이 모두 포함되어 광범위한 응용 분야에 적합합니다.
  • 확장된 컨텍스트 창: 대부분의 Qwen 3 모델은 128K 토큰 컨텍스트 창을 지원하여 긴 문서와 복잡한 작업을 처리하는 데 도움이 됩니다.
  • 다중 모드 지원: Qwen 3 모델은 텍스트, 이미지, 오디오, 비디오 입력을 처리할 수 있어 실시간 음성 상호작용 및 시각적 데이터 분석을 포함한 다양한 애플리케이션에 적합합니다.
  • 오픈 소스 접근성: 모든 Qwen 3 모델은 Apache 2.0 라이선스에 따라 라이선스가 부여되었으며 Hugging Face 및 ModelScope와 같은 플랫폼을 통해 사용할 수 있습니다.

기술 아키텍처

모델 변형

Qwen 3은 다양한 계산 요구 사항을 해결하기 위해 다양한 모델을 포함합니다.

  • 조밀한 모델: 0.6B, 1.7B, 4B, 8B, 14B, 32B 매개변수 크기로 제공됩니다.
  • 희소 모델: 30B 활성화 매개변수가 있는 3B 모델과 235B 활성화 매개변수가 있는 22B 모델을 포함합니다.

이 아키텍처는 모바일 기기부터 고성능 서버까지 다양한 하드웨어 구성에 효율적으로 배포할 수 있도록 해줍니다.

맥락적 이해

128K 토큰 컨텍스트 창을 갖춘 Qwen 3 모델은 장기간의 상호작용에서도 일관성을 유지할 수 있어 장문 콘텐츠 생성 및 복잡한 문제 해결과 같이 심층적인 맥락적 이해가 필요한 작업에 능숙합니다.

Qwen 시리즈의 진화

웬에서 웬까지 3

Qwen 시리즈는 상당한 발전을 거쳤습니다.

  • 쿠웬: 기본 사전 학습된 언어 모델로 도입되어 다양한 작업에서 뛰어난 성능을 보여줍니다.
  • Qwen-채팅: 인간 정렬 기술로 미세하게 조정된 채팅 모델로, 고급 도구 사용 및 계획 기능을 선보입니다.
  • Qwen2: 0.5억 개에서 72억 개까지의 매개변수 범위를 특징으로 하는 명령어 조정 언어 모델로 모델 세트를 확장했습니다. 주력 모델인 Qwen2-72B는 다양한 벤치마크에서 뛰어난 성능을 보였습니다.
  • Qwen2.5: 텍스트, 이미지, 비디오, 오디오를 처리하고 텍스트와 오디오 출력을 모두 생성할 수 있는 Qwen2.5-Omni와 같은 모델을 도입했습니다.
  • 퀀 3: 최신 버전은 하이브리드 추론 기능과 향상된 효율성을 통합하여 시리즈에서 중요한 발전을 이루었습니다.

벤치마크 성능

QwQ 및 Qwen2.5와 같은 기존 모델보다 훨씬 뛰어난 성능을 보이는 Qwen3는 탁월한 수학, 코딩, 상식적 추론, 창의적 글쓰기 및 대화형 대화 기능을 제공합니다. Qwen3-30B-A3B 모델은 30.5억 개의 매개변수(활성화된 매개변수는 3.3억 개), 48개의 레이어, 128명의 전문가(작업당 8명 활성화)를 포함하고 있으며, YaRN을 통해 최대 131만 XNUMX천 개의 토큰 컨텍스트를 지원하여 오픈 소스 모델의 새로운 기준을 제시합니다.

  • AIME25: Qwen3는 81.5점을 획득하여 오픈소스 신기록을 세웠습니다.
  • 라이브코드벤치: Qwen3는 Grok70보다 더 나은 3점을 받았습니다.
  • 아레나하드: Qwen3는 1점을 기록하며 OpenAl-o1과 DeepSeek-FR95.6을 앞질렀습니다.

코드 예제

개발자는 다음 Python 코드 조각을 사용하여 Qwen 3 모델과 상호 작용할 수 있습니다.

from transformers import AutoTokenizer, AutoModelForCausalLM

# Load tokenizer and model

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")

# Encode input prompt

input_text = "Explain the significance of hybrid reasoning in AI models."
input_ids = tokenizer.encode(input_text, return_tensors="pt")

# Generate response

output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)

print(response)

이 예제에서는 Hugging Face Transformers 라이브러리를 사용하여 Qwen 3 모델을 로드하고 주어진 프롬프트에 대한 응답을 생성하는 방법을 보여줍니다.

결론

Qwen 3는 향상된 추론 기능, 확장성, 그리고 멀티모달 지원을 제공하여 알리바바 AI 개발에 있어 중요한 이정표를 제시합니다. Apache 2.0 라이선스에 따른 오픈소스 제공은 AI 커뮤니티의 광범위한 도입과 혁신을 촉진합니다. AI 환경이 끊임없이 발전함에 따라, Qwen 3는 알리바바를 국내외 시장에서 강력한 입지를 확보하는 데 기여할 것입니다.


전화하는 방법 Qwen 3 CometAPI의 API

Qwen 3 CometAPI의 API 가격:

모델 버전퀀3 235B A22B퀀: 퀀3 30B A3B퀀3 8B
CometAPI 가격입력 토큰: $1.6 / M 토큰입력 토큰: $0.4/M 토큰입력 토큰: $0.32 / M 토큰
출력 토큰: $4.8 / M 토큰출력 토큰: $1.2 / M 토큰출력 토큰: $0.96 / M 토큰
모델명qwen3-235b-a22bqwen3-30b-a3bqwen3-8b
설명하다이 모델은 Qwen3 시리즈의 주력 모델로, 235억 개의 매개변수를 갖추고 있으며 MoE(Mixture of Experts) 아키텍처를 활용합니다.qwen3-30b-a3b: 30억 개의 매개변수를 통해 성능과 리소스 요구 사항의 균형을 맞춰 엔터프라이즈급 애플리케이션에 적합합니다.800억 개의 매개변수를 갖춘 가벼운 모델로, 리소스가 제한된 환경(예: 모바일 기기나 저구성 서버)을 위해 특별히 설계되었습니다.

필수 단계

  • 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
  • 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
  • 이 사이트의 url을 받으세요: https://api.cometapi.com/

사용 방법

  1. "qwen3-235b-a22b""qwen3-30b-a3b""qwen3-8bAPI 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다.
  2. 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
  3. 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
  4. . API 응답을 처리하여 생성된 답변을 얻습니다.

Comet API의 모델 런칭 정보는 다음을 참조하세요. https://api.cometapi.com/new-model.

Comet API의 모델 가격 정보는 다음을 참조하세요. https://api.cometapi.com/pricing.

도 참조 Qwen 2.5 최대 API

SHARE THIS BLOG

하나의 API로 500개 이상의 모델

최대 20% 할인