모델
GPT Image 2는 빠르고 고품질의 이미지 생성 및 편집을 위한 OpenAI의 최첨단 이미지 생성 모델입니다. 유연한 이미지 크기와 고충실도 이미지 입력을 지원합니다. 초당:$0.063
Seedance 2.0은 시네마틱하고 멀티샷 내러티브 비디오 생성에 초점을 맞춘 ByteDance의 차세대 멀티모달 비디오 기반 모델입니다. 단일 샷 텍스트-투-비디오 데모와 달리, Seedance 2.0은 레퍼런스 기반 제어(이미지, 짧은 클립, 오디오), 샷 전반의 캐릭터/스타일 일관성, 그리고 네이티브 오디오/비디오 동기화를 강조합니다 — 전문 창작 및 프리비주얼라이제이션 워크플로우에서 AI 비디오가 유용하게 쓰이도록 하는 것을 목표로 합니다.Claude Sonnet 4.6은 지금까지 가장 역량이 뛰어난 Sonnet 모델입니다. 코딩, 컴퓨터 사용, 장문맥 추론, 에이전트 계획, 지식 업무, 디자인 전반에 걸쳐 모델의 역량을 전면 업그레이드한 버전입니다. Sonnet 4.6은 베타 단계의 1M 토큰 컨텍스트 윈도우도 제공합니다. The smartest model, built for speed, combines cutting-edge intelligence with outstanding search and factual evidence. 에이전트적 추론, 지식 작업, 도구 사용에 뛰어납니다. 극도로 복잡한 논리와 전문적 요구에 맞춰 설계된 고도화된 모델로서, 심층 추론과 정밀 분석 역량에서 최고 수준을 대표합니다. 탁월한 성능과 효율적인 응답성을 균형 있게 갖추고, 포괄적이고 안정적인 범용 AI 서비스 제공에 전념하는 차세대 멀티모달 플래그십 모델. 요청당:$0.04
GPT Image 2는 빠르고 고품질의 이미지 생성 및 편집을 위한 openai의 최첨단 이미지 생성 모델입니다. 유연한 이미지 크기와 고충실도 이미지 입력을 지원합니다.DeepSeek V4 Pro는 DeepSeek의 대규모 Mixture-of-Experts 모델로, 총 파라미터 1.6T와 활성 파라미터 49B를 갖추고 있으며 1M 토큰 컨텍스트 윈도우를 지원합니다. 고도 추론, 코딩, 그리고 장기적 에이전트 워크플로우를 위해 설계되었으며, 지식, 수학, 소프트웨어 엔지니어링 벤치마크 전반에서 강력한 성능을 보입니다. DeepSeek V4 Flash는 DeepSeek의 효율성에 최적화된 Mixture-of-Experts 모델로, 284B 총 파라미터와 13B 활성화 파라미터를 갖추고 1M-token 컨텍스트 윈도우를 지원합니다. 고속 인퍼런스와 고처리량 워크로드에 맞춰 설계되었으며, 강력한 추론 및 코딩 성능을 유지합니다. MiniMax-M2.7은 표준 버전과 동일한 최고 수준의 지능—재귀적 자기 진화와 전문가 수준의 오피스 생산성을 포함—을 제공하지만, 1초 미만의 지연 시간과 고속 토큰 생성이 필요한 애플리케이션을 위해 설계되었습니다. 강화된 추론 백본 아키텍처를 활용하여 출력 속도는 표준 모델 대비 66% 더 빠르며 100 tps에 도달합니다. 대화형 프로그래밍 어시스턴트, 실시간 에이전트 루프 실행, 그리고 엄격한 완료 시간 요구 사항이 있는 고처리량 엔터프라이즈 파이프라인에 가장 선호되는 선택입니다. 맥락:400,000
GPT-5.4 nano는 속도와 비용이 최우선인 분류, 데이터 추출, 순위화, 하위 에이전트 등의 작업을 위해 설계되었습니다.맥락:400,000
GPT-5.4 mini는 대규모 워크로드를 위해 설계된 더 빠르고 더 효율적인 모델에 GPT-5.4의 강점을 접목합니다.맥락:1,050,000
더 지능적이고 더 정밀한 응답을 생성하는 GPT-5.4 버전.핵심 기능 개요: 해상도: 최대 4K(4096×4096), Pro와 동급. 참조 이미지 일관성: 최대 14개의 참조 이미지(오브젝트 10개 + 캐릭터 4개)로 스타일/캐릭터 일관성을 유지. 극단적인 종횡비: 새로운 1:4, 4:1, 1:8, 8:1 비율이 추가되어 긴 이미지, 포스터, 배너에 적합. 텍스트 렌더링: 고급 텍스트 생성, 인포그래픽 및 마케팅 포스터 레이아웃에 적합. 검색 기능 강화: Google 검색 + 이미지 검색 통합. 그라운딩: 내장된 사고 프로세스; 복잡한 프롬프트는 생성 전에 추론됨. Qwen3.7-Max의 핵심 강점은 에이전트 역량의 폭과 깊이에 있다. 코딩에서는 프런트엔드 프로토타이핑부터 복잡한 다중 파일 엔지니어링 프로젝트까지 모두 처리한다. 업무 및 생산성 작업에서는 MCP 통합과 멀티 에이전트 협업을 통해 워크플로 자동화를 구현한다. 장기적 자율 실행에서는 1,000회 이상의 도구 호출이 포함된 35시간의 완전 자율 커널 최적화 실험 전반에 걸쳐 일관된 추론을 유지했으며, 지속적이고 안정적인 실행 능력을 설득력 있게 입증했다. 또한 Claude Code, OpenClaw, Qwen Code 또는 기타 프레임워크에 배포되더라도 안정적으로 동작하며, 일관되게 강력한 크로스 프레임워크 일반화 성능을 제공한다. GPT-5.5는 코드 작성, 온라인 리서치, 데이터 분석, 그리고 도구 간 연계 작업에서 뛰어납니다. 이 모델은 복잡한 다단계 작업을 처리하는 자율성을 높였을 뿐만 아니라 이전 버전과 동일한 지연 시간을 유지하면서 추론 능력과 실행 효율도 크게 향상시켰으며, 이는 AI 기반 오피스 자동화로 나아가는 중요한 진전을 의미합니다. 맥락:2,000,000
Grok 4.20 릴리스는 멀티에이전트 아키텍처(실시간으로 조율되는 여러 특화 에이전트), 확장된 컨텍스트 모드, 그리고 지시 준수 능력, 환각 감소, 구조화된/도구 연계 출력에 대한 집중적인 개선을 도입합니다.Qwen 3.6-Plus가 이제 이용 가능하며, 강화된 코드 개발 기능과 멀티모달 인식 및 추론 효율 향상으로 Vibe Coding 경험이 한층 더 좋아졌습니다. Kimi K2.6은 Kimi의 최신이자 가장 지능적인 모델로, 더 강력하고 더욱 안정적인 장기 코드 작성 능력과 크게 향상된 지시 준수 및 자기 교정 능력을 갖추었으며, 텍스트, 이미지, 비디오 입력, 사고 및 비사고 모드, 대화 및 에이전트 작업을 지원합니다. GLM-5.1(2026년 4월 출시)은 장기적 자율 작업을 위해 설계되었습니다. 짧은 상호작용에 최적화된 기존 모델과 달리, GLM-5.1은 목표 정렬을 유지하고 전략 표류를 줄이며 장기간에 걸쳐 프로덕션급 결과를 제공합니다 — 단일 복합 과제에 대해 최대 8시간 연속 자율 작업이 가능합니다. 이는 에이전트형 엔지니어링에서의 중대한 도약을 의미하며, 평가의 초점을 단일 턴 지능에서 실제 환경의 지속적 실행으로 전환합니다. Claude Mythos Preview는 현재까지 우리의 가장 강력한 프런티어 모델이며,
이전 프런티어 모델인 Claude Opus 4.6과 비교해 여러 평가 벤치마크 점수에서 놀라운 도약을 보여줍니다. 맥락:200k
GLM-5 Turbo는 Z.ai의 새로운 모델로, OpenClaw 시나리오와 같은 에이전트 주도형 환경에서 빠른 추론과 강력한 성능을 발휘하도록 설계되었습니다.맥락:1,050,000
GPT-5.4는 복잡한 전문 업무를 위한 최첨단 모델입니다. Reasoning.effort은 다음을 지원합니다: none(기본값), low, medium, high 및 xhigh.ChatGPT에서 사용되는 GPT-5.3 Instant 모델 Gemini 3.1 Flash-Lite는 Google의 Gemini 3 시리즈에 속한, 매우 비용 효율적이고 저지연인 Tier-3 모델로, 최대 추론 깊이보다 처리량과 속도가 더 중요한 대량 처리 프로덕션 AI 워크플로를 위해 설계되었습니다. 대형 멀티모달 컨텍스트 윈도우와 효율적인 추론 성능을 결합하면서, 대부분의 플래그십 동급 모델보다 더 낮은 비용으로 제공됩니다. Claude Opus 4.6는 Anthropic의 “Opus”급 대규모 언어 모델로, 2026년 2월에 출시되었습니다. 지식 업무와 연구 워크플로를 위한 주력 모델로 자리매김했으며 — 긴 컨텍스트 추론, 다단계 계획, 도구 사용(에이전트형 소프트웨어 워크플로 포함), 그리고 슬라이드와 스프레드시트 자동 생성과 같은 컴퓨터 활용 작업을 개선합니다. 요청당:$0.008
FLUX.2 [max]는 Black Forest Labs (BFL)의 최상급 시각 지능 모델로, 프로덕션 워크플로: 마케팅, 제품 사진, 전자상거래, 크리에이티브 파이프라인, 그리고 캐릭터/제품 아이덴티티의 일관성, 정확한 텍스트 렌더링, 멀티 메가픽셀 해상도에서의 포토리얼 디테일을 요구하는 모든 애플리케이션을 위해 설계되었습니다. 아키텍처는 강력한 프롬프트 준수, 다중 참조 융합(최대 10개의 입력 이미지), 그리고 근거 기반 생성(이미지 생성 시 최신 웹 컨텍스트를 반영하는 능력)을 위해 정교하게 설계되었습니다.X
Black Forest Labs/FLUX 2 MAX
맥락:2M
요청당:$0.056
FLUX.2 [max]는 Black Forest Labs(BFL)의 FLUX.2 제품군에서 플래그십이자 최고 품질의 버전입니다. 최대한의 충실도, 프롬프트 준수, 캐릭터·오브젝트·조명·색상 전반에 걸친 편집 일관성에 초점을 맞춘 전문가급 텍스트→이미지 생성 및 이미지 편집 모델로 포지셔닝되었습니다. BFL과 파트너 레지스트리는 FLUX.2 [max]를 다중 레퍼런스 편집, 그라운딩된 생성 기능을 갖춘 최상위 FLUX.2 버전으로 설명합니다.