DeepSeek, DeepSeek R1-0528 공개: 새로운 기능과 성능

중국 AI 스타트업 DeepSeek은 오늘 자사의 주력 R1 추론 모델에 대한 점진적이면서도 영향력 있는 업데이트를 출시했습니다. 딥시크 R1-0528, Hugging Face 플랫폼에서. MIT 라이선스에 따라 게시됨 2025 년 5 월 28 일이 업데이트는 1년 2025월에 출시된 R1의 초기 버전을 기반으로 합니다. R0528은 오픈 소스 언어 모델이 성능과 비용 효율성 측면에서 독점 제품과 경쟁할 수 있음을 처음으로 입증했습니다. 내부적으로는 "사소한 시험 업그레이드"로 설명되었지만, RXNUMX-XNUMX은 추론 정교화, 코드 합성 정확도 및 모델 신뢰성 측면에서 상당한 개선을 이루었습니다.

DeepSeek R1 업데이트 주요 내용

확장된 맥락적 "사고"

전문가 혼합(MoE) 계층과 최적화된 주의 메커니즘을 활용하는 R1-0528은 장기간 입력에 대해 더 깊은 추론 체인을 유지할 수 있으므로 확장된 컨텍스트 유지를 요구하는 워크플로에 적합합니다().

향상된 신뢰성 및 일관성

개발자들은 길고 맥락이 풍부한 쿼리를 처리할 때 반복되는 프롬프트에서 출력이 더 안정적이며, 답변 품질의 편차가 줄어들고 시간 초과 오류가 줄어든다고 보고합니다.

향상된 추론

기본 아키텍처는 그대로 유지됩니다. 671 억 매개 변수원래의 deepseek R1과 동일한 주의 메커니즘을 활용하지만, 더욱 정교한 가중치와 더 긴 "사고" 기능을 제공합니다.

내부 평가 결과, 복잡한 쿼리에서 보다 일관된 다단계 추론을 통해 논리 집약적 벤치마크에서 측정 가능한 성과가 나타났습니다.

우수한 코드 생성

LiveCodeBench 벤치마크는 AI 지원 코딩에서 뚜렷한 성과를 보고합니다. R1-0528은 현재 코드 작업을 위한 중국산 모델 중 최고 순위를 기록했으며, OpenAI의 o4-mini-high, o3-high, o4-mini-medium 구성에 이어 XNUMX위를 차지했습니다.

코딩 정확도와 효율성 면에서 Alibaba의 Qwen 3과 Anthropic의 Claude 3.7보다 우수한 성능을 보입니다.

기술 성과

지표/벤치마크	R1-0528	R1(2025년 XNUMX월)	선도적인 독점
종합 LLM 점수	중앙값 69.45	~ 67.8	OpenAI o3/o4-미니(~70–72)
코드 생성 순위	중국 모델 중 1위, 전 세계 4위	중국 모델 중 2위	OpenAI o4-mini & o3 뒤에; Grok 3 mini보다 앞서
컨텍스트 창	163 토큰(약 840배 원래)	81개 토큰	OpenAI o3-high와 유사
추론 효율성	37개의 활성 매개변수 / 총 671개의 매개변수	같은	다른 대규모 오픈 소스와 유사

벤치마크 플랫폼:

라이브코드벤치: 코딩 작업에서는 R1-0528이 OpenAI의 o4-mini와 o3 바로 아래에 있으며, xAI의 Grok 3 mini와 Alibaba의 Qwen 3을 능가합니다.

복합 LLM 집계(MMLU, HumanEval, GSM8K, BBH, TruthfulQA): 중간 성능은 다음과 같습니다. 69.45클로드와 제미니의 제품과 비교했을 때 매우 가까운 거리에 위치합니다(Analytics Vidhya).

DeepSeek, DeepSeek R1-0528 공개: 새로운 기능과 성능

기억과 맥락:

확장된 컨텍스트 창은 일관성 손실을 최소화하면서 코드베이스, 장문 문서 및 다중 턴 대화를 지원합니다.

오픈소스 라이선싱 및 접근성

Hugging Face에서 공개 모델 카드 없이 출시된 R1-0528 무게 및 구성 파일은 여전히 다음에서 완전히 액세스할 수 있습니다. MIT 면허제한 없는 상업적 사용과 커뮤니티 주도 수정을 허용합니다. DeepSeek의 라이선스 선택은 "개방형 가중치" 배포 전략을 지속하여 연구 기관과 스타트업 모두가 부담 없이 모델을 통합할 수 있도록 보장합니다.

시장 영향 및 경쟁 환경

DeepSeek의 1년 2025월 R3 출시는 최첨단 AI에 필요한 비용과 규모에 대한 기존의 통념을 뒤엎는 결과를 낳았고, 이로 인해 미국 경쟁사들은 가격을 조정하고 더 가벼운 모델(예: OpenAI의 o1 Mini)을 출시하게 되었습니다. DeepSeek은 R0528-XNUMX을 통해 오픈소스 선두 기업으로서의 입지를 재확인하며 OpenAI, Google Gemini, Alibaba, Anthropic 등과의 성능 및 가격 측면에서 경쟁을 가속화하고 있습니다.

미래 전망

DeepSeek R1은 1월 출시 이후 주요 AI 기업들의 전략적 대응을 이미 촉발해 왔으며, 특히 OpenAI의 가격 조정과 구글의 Gemini 모델 로드맵에 영향을 미쳤습니다. R0528-XNUMX 업데이트는 특히 독점 LLM에 비해 비용 효율적이면서도 고성능의 대안을 모색하는 기업들 사이에서 경쟁 압력을 심화시킬 것으로 예상됩니다. 한편, 미국 규제 당국은 DeepSeek의 급속한 발전에 대해 국가 안보 우려를 제기하며 오픈소스 AI 확산의 지정학적 위험성을 강조했습니다.

시작 가이드

CometAPI는 수백 개의 AI 모델을 일관된 엔드포인트로 통합하는 통합 REST 인터페이스를 제공하며, 내장된 API 키 관리, 사용량 할당량 및 청구 대시보드를 통해 여러 공급업체 URL과 자격 증명을 일일이 관리할 필요가 없습니다.

개발자는 최신 정보에 액세스할 수 있습니다. 딥시크 R1 API (모델명: deepseek-r1-0528)를 통해 코멧API시작하려면 모델의 기능을 탐색하세요. 운동장 그리고 상담하십시오 API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하여 API 키와 CometAPI 가격을 확인했는지 확인하세요.

입력 토큰: $0.44 / M 토큰
출력 토큰: $1.752 / M 토큰