モデル
GPT Image 2 は、高速かつ高品質な画像生成と編集のための OpenAI の最先端の画像生成モデルです。柔軟な画像サイズに対応し、高忠実度の画像入力をサポートします。 毎秒:$0.063
Seedance 2.0 は、ByteDance の次世代マルチモーダル動画基盤モデルで、シネマティックかつマルチショットのナラティブ動画生成に特化しています。単一ショットのテキストから動画へのデモとは異なり、Seedance 2.0 は参照ベースのコントロール(画像、短いクリップ、音声)、ショットをまたいだキャラクター/スタイルの一貫性、ネイティブな音声/映像の同期を重視し、プロフェッショナルなクリエイティブおよびプリビジュアライゼーションのワークフローで役立つ AI 動画の実現を目指しています。エージェントやコーディング向けの最も高知能なモデル Claude Sonnet 4.6 は、これまでで最も高性能な Sonnet モデルです。コーディング、コンピューターの利用、長文脈推論、エージェントの計画立案、ナレッジワーク、デザインにわたってモデルのスキルを全面的にアップグレードしました。Sonnet 4.6 は、ベータ版で 1M トークンのコンテキストウィンドウも備えています。 The smartest model, built for speed, combines cutting-edge intelligence with outstanding search and factual evidence. エージェント的推論、知識作業、ツール使用に優れている。 極めて複雑なロジックと専門的要件に対応するよう設計された先進的なモデルであり、深い推論と精緻な分析能力において最高水準を体現します。 卓越した性能と効率的な応答を両立し、包括的で安定した汎用AIサービスの提供に特化した、次世代マルチモーダル・フラッグシップモデル。 リクエストごと:$0.04
GPT Image 2 は、高速かつ高品質な画像生成および編集のための、openai の最先端の画像生成モデルです。柔軟な画像サイズと高忠実度の画像入力に対応しています。DeepSeek V4 Proは、総パラメータ数1.6T、活性化パラメータ49Bを備え、1Mトークンのコンテキストウィンドウに対応する、DeepSeekの大規模なMixture-of-Expertsモデルです。高度な推論、コーディング、長期的なエージェントワークフロー向けに設計されており、知識、数学、ソフトウェアエンジニアリングのベンチマークにおいて高い性能を発揮します。 DeepSeek V4 Flashは、DeepSeekによる効率性を最適化したMixture-of-Expertsモデルで、総パラメータ数は284B、アクティブなパラメータ数は13B、1M-tokenのコンテキストウィンドウに対応しています。高速な推論と高スループットのワークロード向けに設計されており、強力な推論能力とコーディング性能を維持します。 MiniMax-M2.7 は、標準モデルと同等の最高水準の知能(再帰的自己進化やエキスパート級のオフィス生産性を含む)を備えつつ、サブ秒レイテンシと高速なトークン生成を要するアプリケーション向けに設計されています。強化された推論バックボーンアーキテクチャを活用し、出力速度は標準モデル比で66%高速(100 tpsに到達)です。インタラクティブなプログラミングアシスタント、リアルタイムのエージェントループ実行、厳格な完了時間要件を伴う高スループットのエ illusions}} 文脈:400,000
GPT-5.4 nano は、分類、データ抽出、ランキング、サブエージェントなど、速度とコストが最も重要となるタスク向けに設計されています。文脈:400,000
GPT-5.4 mini は、GPT-5.4 の強みを、高スループットのワークロード向けに設計された、より高速で効率的なモデルにもたらします。文脈:1,050,000
より賢く、より正確な応答を生成する GPT-5.4 のバージョン。コア機能の概要: 解像度: 最大4K(4096×4096)、Proと同等。参照画像の一貫性: 参照画像は最大14枚(オブジェクト10件 + キャラクター4件)、スタイル/キャラクターの一貫性を維持。極端なアスペクト比: 1:4、4:1、1:8、8:1を新規追加、縦長画像・ポスター・バナーに最適。テキストレンダリング: 高度なテキスト生成、インフォグラフィックおよびマーケティングポスターのレイアウトに最適。検索機能の強化: Google Search + Image Searchを統合。グラウンディング: 思考プロセスを内蔵、複雑なプロンプトは生成前に推論。 Qwen3.7-Max の中核的な強みは、エージェントとしての能力の幅広さと深さにあります。コーディングでは、フロントエンドのプロトタイピングから複数ファイルにまたがる複雑なエンジニアリングプロジェクトまで幅広く対応します。オフィス業務や生産性向上の作業では、MCP 連携とマルチエージェント協調によりワークフローの自動化を実現します。長期にわたる自律実行においては、1,000回を超えるツール呼び出しを伴う35時間に及ぶ完全自律のカーネル最適化実験を通じて一貫した推論を維持し、その持続的かつ安定した実行を説得力をもって実証しました。さらに、フレームワーク横断の汎化能力も一貫して強力で、Claude Code、OpenClaw、Qwen Code を含む各種フレームワークに展開しても信頼性高く動作します。 GPT-5.5は、コーディング、オンラインリサーチ、データ分析、ツール横断での操作に優れています。本モデルは、複雑なマルチステップタスクの処理における自律性を高めただけでなく、先行モデルと同等のレイテンシを維持しつつ、推論能力と実行効率も大幅に向上させており、AIによるオフィスオートメーションの実現に向けた重要な一歩となります。 文脈:2,000,000
Grok 4.20のリリースでは、マルチエージェント・アーキテクチャ(複数の専門特化したエージェントがリアルタイムで協調)を導入し、コンテキストモードを拡張するとともに、指示追従性、ハルシネーションの低減、構造化/ツール対応の出力に焦点を当てた改善を行いました。Qwen 3.6-Plus が利用可能になり、コード開発機能が強化され、マルチモーダル認識・推論の効率も向上し、Vibe Coding の体験がさらに向上しました。 Kimi K2.6は、Kimiの最新かつ最もインテリジェントなモデルであり、より強力で安定した長時間にわたるコード生成能力、指示追従性と自己訂正能力の大幅な向上を備え、テキスト・画像・動画の入力、思考モードと非思考モード、対話およびエージェントタスクをサポートします。 GLM-5.1(2026年4月リリース)は、長期的な自律タスク向けに専用設計されています。短い対話に最適化された従来のモデルとは異なり、GLM-5.1は目標の整合性を維持し、戦略の逸脱を抑制し、長期間にわたってプロダクショングレードの成果を提供します—単一の複雑なタスクに対して最大8時間の連続自律実行が可能です。これはエージェントエンジニアリングにおける大きな飛躍であり、評価を単一ターンの知能から実世界での持続的な実行へとシフトさせます。 Claude Mythos Preview は、当社のこれまでで最も高性能なフロンティアモデルであり、
従来のフロンティアモデルである Claude Opus 4.6 と比べ、多くの評価ベンチマークでスコアが顕著に向上していることを示しています。 文脈:200k
GLM-5 Turbo は、OpenClaw シナリオのようなエージェント駆動型環境において、高速な推論と優れた性能を実現するよう設計された、Z.ai の新しいモデルです。文脈:1,050,000
GPT-5.4 は、複雑な専門業務向けのフロンティアモデルです。Reasoning.effort は次をサポートします: none(デフォルト)、low、medium、high、xhigh。ChatGPTで使用されているGPT-5.3 Instant モデル Gemini 3.1 Flash-Lite は、Google の Gemini 3 シリーズにおける、コスト効率に優れ低レイテンシな Tier-3 モデルで、最大限の推論深度よりもスループットと速度が重視される大規模なプロダクション AI ワークフロー向けに設計されています。大きなマルチモーダルなコンテキストウィンドウと効率的な推論性能を兼ね備え、多くのフラッグシップモデルよりも低コストで提供されます。 Claude Opus 4.6 は、Anthropic の「Opus」クラスの大規模言語モデルで、2026年2月にリリースされた。ナレッジワークや研究ワークフローの主力として位置づけられており、長文脈での推論、多段階の計画立案、ツールの利用(エージェント型ソフトウェアワークフローを含む)、およびスライドやスプレッドシートの自動生成といったコンピュータ操作タスクを強化する。 リクエストごと:$0.008
FLUX.2 [max] は Black Forest Labs (BFL) による最高水準の視覚インテリジェンスモデルで、プロダクション向けのワークフロー: マーケティング、商品写真、eコマース、クリエイティブなパイプライン、および一貫したキャラクター/製品アイデンティティ、正確なテキストレンダリング、マルチメガピクセル解像度でのフォトリアルなディテールを必要とするあらゆるアプリケーションに向けて設計されています。アーキテクチャは、強力なプロンプト追従、複数参照の融合(最大10枚の入力画像)、およびグラウンデッド生成(画像生成時に最新のウェブコンテキストを取り込む能力)に対応するよう設計されています。X
Black Forest Labs/FLUX 2 MAX
文脈:2M
リクエストごと:$0.056
FLUX.2 [max] は、Black Forest Labs (BFL) の FLUX.2 ファミリーにおけるフラッグシップかつ最高品質のバリアントです。最大限の忠実度、プロンプト遵守、キャラクター、オブジェクト、ライティング、色にわたる編集の一貫性に重点を置いた、プロフェッショナルグレードのテキスト→画像生成および画像編集モデルとして位置付けられています。BFL およびパートナーのレジストリは、FLUX.2 [max] を、マルチリファレンス編集やグラウンデッド生成向けの機能を備えた、FLUX.2 の最上位バリアントとして説明しています。