Home/Models/OpenAI/GPT 5.1 Codex Max
O

GPT 5.1 Codex Max

Masukan:$1/M
Keluaran:$8/M
Konteks:400K
Keluaran Maksimum:128K
GPT-5.1-Codex-Max ialah model pengaturcaraan berasaskan agen yang dibina khas oleh OpenAI dalam keluarga GPT-5.1, dioptimumkan untuk melaksanakan aliran kerja kejuruteraan perisian jangka panjang (refaktor, gelung agen selama berjam-jam, automasi terminal, pelaksanaan ujian dan semakan kod) dengan kebolehpercayaan dan kecekapan token yang lebih tinggi berbanding pendahulunya.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API

Apakah GPT-5.1-Codex-Max?

GPT-5.1-Codex-Max ialah model keluarga Codex yang ditala dan dibina khusus untuk aliran kerja pengkodan beragen — iaitu tugas kejuruteraan autonomi berbilang langkah seperti pemfaktoran semula pada skala repositori, sesi penyahpepijatan yang panjang, gelung agen berjam-jam, semakan kod, dan penggunaan alat secara programatik. Ia ditujukan untuk aliran kerja pembangun di mana model perlu:

  • Mengekalkan keadaan merentas banyak suntingan dan interaksi;
  • Mengendalikan alat dan terminal (menjalankan ujian, mengkompilasi, memasang, mengeluarkan arahan git) sebagai sebahagian daripada rantaian automatik;
  • Menghasilkan tampalan, menjalankan ujian, dan menyediakan log serta rujukan yang boleh dijejaki untuk output

Ciri utama

  • Pemadatan & Konteks Berbilang Tetingkap: Dilatih secara natif untuk memadatkan sejarah dan beroperasi secara koheren merentas berbilang tetingkap konteks, membolehkan kesinambungan pada skala projek.
  • Penggunaan alat beragen (terminal + peralatan): Keupayaan dipertingkat untuk menjalankan urutan terminal, memasang/membina/menguji, dan bertindak balas kepada output program.
  • Kecekapan token lebih tinggi: Direka untuk memperuntukkan token dengan lebih cekap bagi tugas kecil sambil menggunakan rentak penaakulan yang lebih panjang untuk tugas kompleks.
  • Pemfaktoran semula & suntingan besar: Lebih baik dalam pemfaktoran merentas fail, migrasi dan tampalan pada peringkat repositori (penilaian dalaman OpenAI).
  • Mod usaha penaakulan: Tahap usaha penaakulan baharu untuk penaakulan lebih panjang yang memerlukan banyak pengiraan (cth., Extra High / xhigh untuk tugas yang tidak peka latensi).

Keupayaan teknikal (apa yang dilakukannya dengan baik)

  • Pemfaktoran semula jangka panjang & gelung berulang: boleh mengekalkan pemfaktoran semula pada skala projek dan sesi penyahpepijatan berjam-jam (OpenAI melaporkan >24j dalam demo dalaman) dengan membuat iterasi, menjalankan ujian, meringkaskan kegagalan dan mengemas kini kod.
  • Pembetulan pepijat dunia nyata: prestasi kukuh pada penanda aras penampalan repositori sebenar (SWE-Bench Verified: OpenAI melaporkan 77.9% untuk Codex-Max dalam tetapan xhigh/extra-effort).
  • Kecekapan Terminal/Alat: membaca log, memanggil pengkompil/ujian, menyunting fail, mencipta PR — iaitu berfungsi sebagai agen natif terminal dengan panggilan alat yang jelas dan boleh diperiksa.
  • Input diterima: gesaan teks standard serta snippet kod, snapshot repositori (melalui integrasi alat/IDE), tangkapan skrin/tetingkap dalam permukaan Codex di mana visi diaktifkan, dan permintaan panggilan alat (cth., jalankan npm test, buka fail, cipta PR).
  • Output dihasilkan: tampalan kod (diff atau PR), laporan ujian, log larian langkah demi langkah, penjelasan bahasa semula jadi dan ulasan semakan kod beranotasi. Apabila digunakan sebagai agen, ia boleh mengeluarkan panggilan alat berstruktur dan tindakan susulan.

Prestasi penanda aras (hasil terpilih & konteks)

  • SWE-bench Verified (n=500) — GPT-5.1-Codex (high): 73.7%; GPT-5.1-Codex-Max (xhigh): 77.9%. Metrik ini menilai tugas kejuruteraan dunia nyata yang diambil daripada isu GitHub/sumber terbuka.
  • SWE-Lancer IC SWE: GPT-5.1-Codex: 66.3% → GPT-5.1-Codex-Max: 79.9% (OpenAI melaporkan peningkatan pada papan kedudukan tertentu).
  • Terminal-Bench 2.0: GPT-5.1-Codex: 52.8% → GPT-5.1-Codex-Max: 58.1% (peningkatan pada penilaian terminal/penggunaan alat interaktif).

Batasan dan mod kegagalan

  1. Penggunaan dua guna / risiko keselamatan siber: Keupayaan dipertingkat untuk mengendalikan terminal dan menjalankan peralatan menimbulkan kebimbangan dua guna (model boleh membantu kerja keselamatan defensif dan ofensif); OpenAI menekankan kawalan akses berperingkat dan pemantauan.
  2. Tidak sepenuhnya deterministik atau betul: Walaupun dengan prestasi kejuruteraan yang lebih kukuh, model boleh mencadangkan tampalan yang salah atau terlepas semantik kod yang halus (positif/negatif palsu dalam pengesanan pepijat), maka semakan manusia dan ujian CI tetap penting.
  3. Pertukaran kos dan kependaman: Mod usaha tinggi (xhigh) menggunakan lebih banyak pengiraan/masa; gelung agen berjam-jam yang panjang menggunakan kredit atau bajet. Rancang untuk kos dan had kadar. ([OpenAI开发者][2])
  4. Jaminan konteks vs kesinambungan berkesan: Pemadatan membolehkan kesinambungan projek, tetapi jaminan tepat tentang token yang dipelihara dan bagaimana pemadatan mempengaruhi kes terpencil yang jarang berlaku bukanlah pengganti bagi snapshot repositori berversi dan saluran paip yang boleh dihasilkan semula. Gunakan pemadatan sebagai pembantu, bukan satu-satunya sumber kebenaran.

Perbandingan vs Claude Opus 4.5 vs Gemini 3 Pro (peringkat tinggi)

  • Anthropic — Claude Opus 4.5: Penanda aras komuniti dan media secara umum meletakkan Opus 4.5 sedikit mendahului Codex-Max dalam ketepatan pembetulan pepijat mentah (SWE-Bench), dengan kekuatan dalam orkestrasi saintifik dan output yang sangat padat serta cekap token. Opus sering berharga lebih tinggi setiap token tetapi boleh lebih cekap token dalam amalan. Kelebihan Codex-Max ialah pemadatan jangka panjang, integrasi peralatan terminal, dan kecekapan kos untuk larian agen yang panjang.
  • Keluarga Google Gemini (3 Pro dsb.): Varian Gemini kekal kuat pada penanda aras multimodal dan penaakulan umum; dalam domain pengkodan hasilnya berbeza mengikut rangka ujian. Codex-Max dibina khusus untuk pengkodan beragen dan berintegrasi dengan aliran kerja DevTool dengan cara yang model generalis secara lalai tidak lakukan.

Cara mengakses dan menggunakan API GPT-5.1 Codex Max

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke CometAPI console. Dapatkan kunci API kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan kepada API GPT-5.1-Codex-Max

Pilih titik akhir “ gpt-5.1-codex-max” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API di laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. Pembangun memanggil ini melalui API Responses / titik akhir Chat.

Masukkan soalan atau permintaan anda ke dalam medan kandungan — inilah yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Hasil

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan memberikan status tugas dan data output.

Ciri-ciri untuk GPT 5.1 Codex Max

Terokai ciri-ciri utama GPT 5.1 Codex Max, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk GPT 5.1 Codex Max

Terokai harga yang kompetitif untuk GPT 5.1 Codex Max, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana GPT 5.1 Codex Max boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)Diskaun
Masukan:$1/M
Keluaran:$8/M
Masukan:$1.25/M
Keluaran:$10/M
-20%

Kod contoh dan API untuk GPT 5.1 Codex Max

GPT-5.1-Codex-Max ialah model pengaturcaraan berasaskan agen yang dibina khas oleh OpenAI dalam keluarga GPT-5.1, dioptimumkan untuk melaksanakan aliran kerja kejuruteraan perisian jangka panjang (refaktor, gelung agen berbilang jam, automasi terminal, larian ujian dan semakan kod) dengan kebolehpercayaan dan kecekapan token yang lebih tinggi berbanding pendahulunya.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1-codex-max", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Lebih Banyak Model