그록 4.1 API

그록 4.1 는 xAI가 2025년 중반~후반에 출시를 시작한 Grok-4 제품군에 대한 xAI의 점진적인 업그레이드입니다. xAI는 대화 품질 향상, 특히 감성 지능, 창의적 글쓰기, 반응성에 중점을 둔 릴리스로 Grok 4.1을 선보입니다.

주요 특징

두 가지 상호작용 모드: Grok 4.1은 추론("사고") 모드와 비추론 모드(빠르고, 사고하지 않는 즉각적인 응답)로 제공되어, 심의적 사고의 사슬 스타일 출력과 저지연 응답 간의 균형을 맞출 수 있습니다.
대인 관계/감정적 반응 향상: xAI는 EQ-Bench(감성 지능 벤치마크)에서 최고 점수를 보고하며, 이전 버전에 비해 EQ-Bench 평가에서 상당히 높은 Elo를 기록했다고 주장합니다.
더 높은 대화 품질과 감성 지능 인식: Grok 4.1은 새로운 대인 관계/EQ 벤치마크(EQ-Bench3)를 개선하고 다중 턴 일관성과 공감을 향상시켰다고 주장합니다.
툴링 및 웹/X 통합: Grok은 기본 도구 사용(웹 검색, 코드 실행, 에이전트 도구 호출)을 계속 지원하고 있으며, 4.x 제품군은 실시간 검색 통합 및 에이전트 워크플로를 위해 명확하게 설계되었습니다.
Grok 4.1은 정보 오류율을 약 65% 감소시켰고, 환각 발생률을 3배나 줄였습니다. 특히, 외부 검색 도구를 사용한 "비추론 모드"에서는 사실의 일관성이 더욱 안정적으로 유지되었습니다.

모델 제품군 및 구성: Grok 4.1은 Grok 4 제품군의 업데이트 버전으로 Thinking(T) 모드와 Non-Thinking(NT) 모드로 제공됩니다.
훈련 레시피(상위 레벨): 사전 훈련에는 공개 웹 데이터, 제3자 소스, 사용자/계약자 데이터 및 내부적으로 생성된 콘텐츠가 혼합되어 사용되었습니다. 역량 및 안전성 튜닝에는 집중적인 중간 훈련 단계와 훈련 후 지도식 미세 조정, 그리고 RLHF(인간 피드백 및 모델 기반 평가자를 활용한 강화 학습)가 사용되었습니다.
혁신적으로 사용 최첨단 기관 추론 모델 자율적으로 응답 품질을 평가하고 개선하기 위한 보상 모델로 Grok의 답변을 자동으로 검토하여 대규모 반복을 통해 스타일, 논리, 일관성을 개선합니다.

LMArena / 텍스트 아레나: Grok 4.1(및 Grok 4.1 Thinking)은 LMArena의 공개 Text Arena 순위표에서 1400점대 중반의 Elo 레이팅으로 상위권을 차지했습니다(Grok 4.1 Thinking은 약 1483점, Non-thinking은 일부 스냅샷에서 약 1465점). 이러한 점수는 Grok 4.1이 스냅샷 시점에 순위표에 있는 다른 많은 동시대 언어들보다 앞서 있음을 보여줍니다.
EQ-Bench(감성지능):Grok 4.1은 공감/통찰력을 측정하는 LLM 심사 롤플레이 테스트인 EQ-Bench3에서 약 1580대 Elo 범위를 기록했습니다. xAI는 또한 창의적 글쓰기 Elo에서 상당한 개선을 주장합니다(예: 특정 창의적 글쓰기 벤치마크에서 이전 Grok 버전에 비해 약 600 Elo가 향상되었다고 인용).
블라인드 선호도 / A/B 테스트: xAI가 보고했습니다 승률 약 64.8% Grok 4.1은 내부/통제 비교를 통해 기존 Grok 4 릴리스와 비교하여 블라인드 선호도 테스트를 통해 평가되었습니다.
환각과 사실성: xAI/보장 청구는 환각 비율을 줄였습니다(예: 이전 세대에 비해 특정 정보 검색 질의에서 "3배 더 적게"). 이는 타겟팅된 사후 훈련 및 웹 앵커링 전략을 통해 달성되었습니다.

거부와 적대적 견고성: Grok 4.1은 명백히 유해한 요청은 대부분 거부하지만, 신속한 주입과 탈옥은 여전히 적대적 테스트에서 성공률이 0이 아닙니다. xAI는 계속해서 입력 필터를 개선하고 있습니다.
이중 용도 및 생물학: Grok 4.1은 특정 지식 작업에서는 좋은 성능을 보이지만 다단계 실험 추론(FigQA, CloningScenarios)에서는 약점을 보이고, xAI는 이중 사용 문제를 표시하고 제한된 화학 및 생물학적 지식에 대해 타겟팅 필터를 적용합니다.
환각/사실성: xAI는 개선 사항(환각률 감소)을 보고했지만, 모델 카드와 독립적인 검토자는 사실 오류가 남아 있다고 지적했습니다. 사용자는 위험도가 높은 출력을 확인해야 합니다.
아첨과 기만: 아첨과 부정직을 측정하는 지표가 존재하며 이를 구체적으로 평가했습니다. 이전 변수에 비해 개선되었지만 0이 아니므로 UX 디자인에서 고려해야 합니다.

권장 사항 : Grok 4.1을 강력한 대화 및 추론 지원 도구로 취급하지만, 위험성이 높은 사용에는 표준 완화 조치(인간 검토, 출력 검증, 입력 필터링 및 모니터링)를 적용합니다.

고객 중심 대화형 에이전트 감정적 톤, 공감, 대화 선호도가 중요한 경우(지원, 코칭, 조정된 소셜 봇). ()
창의적인 콘텐츠 생성 (내러티브, 마케팅 카피, 스토리텔링) — Grok 4.1은 이 부분에서 큰 개선이 이루어졌다고 주장합니다.
에이전트 프레임워크 및 채팅 도구 호출 및 웹 검색을 사용하는 Grok 제품군은 기본 웹/라이브 검색 및 도구 사용 워크플로를 지원합니다.

에 로그인 코메타피닷컴. 아직 당사 사용자가 아니시라면, 먼저 등록해 주시기 바랍니다.
에 로그인하여 CometAPI 콘솔.
인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.

그록 4.1 API

"**Grok 4.1**API 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다.
바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
. API 응답을 처리하여 생성된 답변을 얻습니다.

CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다. 잡담 :