딥시크 V3.1 DeepSeek의 V 시리즈의 업그레이드는 다음과 같습니다. 하이브리드 "생각/비생각" 고처리량, 저비용 일반 지능 및 에이전트 도구 사용을 목표로 하는 대규모 언어 모델입니다. OpenAI 스타일 API 호환성, 추가 더 스마트한 도구 호출회사 측에 따르면, 더 빠른 생성 속도와 향상된 에이전트 안정성을 제공한다고 합니다.
기본 기능(제공되는 것)
- 이중 추론 모드: 딥시크-채팅 (생각하지 않고 / 더 빠르게) 그리고 딥시크-리저너 (사고력/더 강력한 사고의 흐름/에이전트 기술). UI는 최종 사용자를 위한 "딥씽크(DeepThink)" 토글을 제공합니다.
- 긴 맥락: 공식 자료 및 커뮤니티 보고서는 다음을 강조합니다. 128k 토큰 V3 계열 계보에 대한 컨텍스트 창을 제공합니다. 이를 통해 매우 긴 문서의 종단 간 처리가 가능합니다.
- 개선된 도구/에이전트 처리: 안정적인 도구 호출, 다단계 에이전트 워크플로, 플러그인/도구 통합을 목표로 한 사후 교육 최적화.
기술적 세부 사항(아키텍처, 교육 및 구현)
훈련 코퍼스 및 장기 컨텍스트 엔지니어링. Deepseek V3.1 업데이트는 다음을 강조합니다. 2단계 긴 맥락 확장 이전 V3 체크포인트에 더해, 공개 노트에는 32k 및 128k 확장 단계에 사용되는 주요 추가 토큰이 표시되어 있습니다(DeepSeek에 따르면 확장 단계에 수천억 개의 토큰이 사용되었다고 합니다). 또한 이 릴리스에서는 토크나이저 구성 더 큰 맥락 체제를 지원합니다.
추론을 위한 모델 크기와 마이크로 스케일링. 공개 및 커뮤니티 보고서는 다소 다른 매개변수 계산을 제공합니다(새로운 릴리스에서 공통적인 결과): 타사 인덱서 및 미러 목록 ~671B 매개변수(활성 37B) 일부 런타임 설명에서는 다른 커뮤니티 요약이 보고하는 반면 ~685B 하이브리드 추론 아키텍처의 명목상 크기입니다.
추론 모드 및 엔지니어링 상충관계. Deepseek V3.1은 두 가지 실용적인 추론 모드를 제공합니다. deepseek-chat (표준 턴 기반 채팅에 최적화되어 대기 시간이 짧음) deepseek-reasoner (사고의 연속성과 체계적인 추론을 우선시하는 '사고' 모드).
제한 사항 및 위험
- 벤치마크 성숙도 및 재현성: 많은 성과 주장이 조기에, 지역 사회 중심적으로, 또는 선택적으로 이루어집니다. 독립적이고 표준화된 평가는 아직 뒤처져 있습니다. (위험: 과도한 청구).
- 안전 및 환각: 모든 대규모 LLM과 마찬가지로 Deepseek V3.1은 환각 및 유해 콘텐츠 위험에 노출될 수 있습니다. 더 강력한 추론 모드는 때때로 다음을 생성할 수 있습니다. 자신감이 있지만 틀렸다 다단계 출력. 사용자는 중요 출력에 대해 안전 계층과 인적 검토를 적용해야 합니다. (공급업체나 독립적인 출처는 환각 제거를 주장하지 않습니다.)
- 추론 비용 및 지연 시간: 추론 모드는 지연 시간을 성능과 교환하지만, 대규모 소비자 추론에서는 비용이 추가됩니다. 일부 논평가들은 개방적이고 저렴하며 고속인 모델에 대한 시장 반응이 불안정할 수 있다고 지적합니다.
일반적이고 매력적인 사용 사례
- 장문서 분석 및 요약: 법률, R&D, 문헌 검토 - 종단 간 요약을 위해 128k 토큰 창을 활용하세요.
- 에이전트 워크플로 및 도구 오케스트레이션: 다단계 도구 호출(API, 검색, 계산기)이 필요한 자동화. Deepseek V3.1의 학습 후 에이전트 튜닝은 이러한 안정성을 향상하기 위한 것입니다.
- 코드 생성 및 소프트웨어 지원: 초기 벤치마크 보고서는 강력한 프로그래밍 성능을 강조합니다. 이는 인간의 감독 하에 쌍 프로그래밍, 코드 검토 및 생성 작업에 적합합니다.
- 비용/대기 시간 선택이 중요한 엔터프라이즈 배포: 선택 잡담 저렴하고 빠른 대화 도우미를 위한 모드 및 추론자 오프라인 또는 프리미엄 심층 추론 과제용.
전화하는 방법 Deepseek V3.1 CometAPI의 API
deepseek v3.1 CometAPI의 API 가격 책정, 공식 가격 대비 20% 할인:
| 입력 토큰 | $0.44 |
| 출력 토큰 | $1.32 |
필수 단계
- 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
- 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
- 이 사이트의 url을 받으세요: https://api.cometapi.com/
사용 방법
- "
deepseek-v3.1“ / “deepseek-v3-1-250821API 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다. - 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
- 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
- . API 응답을 처리하여 생성된 답변을 얻습니다.
API 호출
CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다. API doc:
- 핵심 매개 변수:
prompt,max_tokens_to_sample,temperature,stop_sequences - 종점 :
https://api.cometapi.com/v1/chat/completions - 모델 매개 변수 : "
deepseek-v3.1“ / “deepseek-v3-1-250821" - 입증:
Bearer YOUR_CometAPI_API_KEY - 컨텐츠 타입:
application/json.
교체
CometAPI_API_KEY당신의 열쇠로; 다음을 기록하세요 기본 URL.
Python
from openai import OpenAI
client = OpenAI(
api_key=os.environ,
base_url="https://api.cometapi.com/v1/chat/completions" # important
)
resp = client.chat.completions.create(
model="deepseek-v3.1",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize this PDF in 5 bullets."}
],
temperature=0.3,
response_format={"type": "json_object"} # for structured outputs
)
print(resp.choices.message.content)
도 참조 그록 4



