Spesifikasi teknikal — Claude Sonnet 4.6
| Item | Claude Sonnet 4.6 (ringkasan umum) |
|---|---|
| Penyedia | Anthropic |
| Keluarga model | Sonnet (keluarga Claude v4.x) — varian Sonnet 4.6 |
| ID model (kanonik) | claude-sonnet-4-6 |
| Jenis input | Teks (utama). Sokongan terhad/sekunder untuk I/O alat berstruktur/JSON. Tidak diposisikan sebagai model penjanaan imej utama. |
| Jenis output | Teks (bahasa semula jadi, JSON berstruktur, kod, dan payload panggilan alat) |
| Tetingkap konteks | ~200,000 token (anggaran) — direka untuk koherensi berbilang dokumen dan sesi panjang |
| Panggilan fungsi / penggunaan alat | Ya — pemanggilan alat berstruktur, output terikat JSON, penyelarasan gaya agen disokong |
| Multimodaliti | Terhad — Sonnet tertumpu pada teks dan integrasi alat berstruktur; tidak dioptimumkan untuk penjanaan imej. |
| Sorotan nota keluaran | Kestabilan/penambahbaikan dalam penaakulan konteks panjang, varian Sonnet latensi lebih rendah ditala untuk kompromi kelajuan–ketepatan, pematuhan arahan yang dipertingkat. |
Apakah Claude Sonnet 4.6
Claude Sonnet 4.6 ialah evolusi terkini bagi garis model Sonnet, direka untuk menyampaikan prestasi hampir setara Opus pada harga yang lebih berpatutan. Ia menaik taraf Sonnet daripada iterasi 4.5 sebelumnya, membawa pematuhan arahan yang lebih kuat, sokongan konteks yang jauh diperluas, penambahbaikan kemahiran pengkodan dan penggunaan komputer, serta kebolehan penaakulan berbilang langkah yang lebih luas — sambil mengekalkan pariti harga dengan Sonnet 4.5.
Tidak seperti model Opus, yang merupakan model perdana dan dioptimumkan untuk beban kerja agen yang berat, Sonnet 4.6 menyasar pembangun dan kerja pengetahuan umum di mana keupayaan luas dan kos efektif adalah penting.
Ciri Utama Claude Sonnet 4.6
- Tetingkap Konteks 1M Token (Beta): Sonnet 4.6 menyokong sehingga satu juta token konteks dalam beta — kira-kira mencukupi untuk memuatkan keseluruhan pangkalan kod, set kontrak undang-undang, atau berbilang kertas akademik dalam satu permintaan.
- Prestasi Pengkodan Diperbaiki: Berbanding dengan Sonnet 4.5, Sonnet 4.6 menunjukkan peningkatan ketara dalam tugas pembangun dunia nyata dan penanda aras seperti SWE-Bench Verified (skor dilaporkan ~79.6%), menjadikannya sesuai untuk tugas pengkodan kompleks.
- Penggunaan Komputer Dipertingkat: Tahap kecekapan baharu dalam tugas yang melibatkan pengendalian perisian (hamparan, aliran kerja borang web berbilang langkah, dsb.) menghampiri prestasi setara manusia pada ujian OSWorld-Verified.
- Pemikiran Adaptif: Model menggabungkan strategi penaakulan yang dipertingkat dan boleh memperuntukkan pengiraan dalaman secara dinamik untuk menangani masalah kompleks selangkah demi selangkah.
- Pematuhan Arahan Lebih Kuat: Pengguna melaporkan lebih konsisten dan tepat dalam mengikuti permintaan terperinci, dengan halusinasi yang lebih sedikit dan penyelesaian tugas yang lebih baik.
- Keselamatan & Rintangan Suntikan Prompt: Anthropic telah menambah baik kekukuhan berbanding Sonnet 4.5 dalam menahan serangan suntikan prompt dan kerentanan seumpamanya.
Prestasi Penanda Aras Claude Sonnet 4.6
| Penilaian | Claude Sonnet 4.6 (anggaran) | Nota |
|---|---|---|
| SWE-Bench Verified | ~79.6% | Prestasi pengkodan yang kukuh, hampir setara kelas Opus. |
| OSWorld-Verified (Penggunaan Komputer) | ~72.5% | Prestasi tugas hampir setara manusia; berkuasa untuk aliran kerja. |
| ARC-AGI-2 | ~60.4% | Mencerminkan kekuatan penaakulan yang luas. |
Sebagai model pertengahan, Sonnet 4.6 memperkecil jurang prestasi dengan model Opus secara ketara, menjadikannya sesuai untuk banyak tugas yang sebelum ini diperuntukkan kepada kelas perdana.
Claude Sonnet 4.6 vs Model Claude Lain
| Model | Paling Sesuai Untuk | Perbezaan Utama |
|---|---|---|
| Claude Sonnet 4.6 | Pengkodan seimbang, penaakulan, konteks besar | Tetingkap konteks beta yang besar, kos berkesan, kuat untuk tugas aliran kerja. |
| Claude Sonnet 4.5 | Tugas umum peringkat pertengahan | Penanda aras lebih rendah, tetingkap konteks lebih kecil sebelum 4.6. |
| Claude Opus 4.6 | Penaakulan mendalam & pengkodan beragen | Keupayaan penaakulan mentah dan agen yang lebih kuat; lebih mahal. |
Berbanding Sonnet 4.5, keluaran 4.6 meningkatkan kefahaman konteks dan prestasi pada tugas gaya pejabat; berbanding model Opus, Sonnet sedikit di bawah dari segi kuasa penaakulan perdana tetapi sering lebih hampir daripada yang dijangka dalam penanda aras pengkodan dan tugas umum.
Batasan Claude Sonnet 4.6
- Tetingkap Konteks Beta: Konteks 1M token kini dalam beta — penggunaan dan kestabilan mungkin berbeza bergantung pada penggunaan API dan pelan.
- Latensi & Kos: Mengendalikan konteks yang sangat besar meningkatkan kos pengiraan dan mungkin memperkenalkan latensi lebih tinggi pada panggilan API berbanding konteks yang lebih kecil.
- Kehalusan Penanda Aras: Walaupun kukuh dalam ujian yang dilaporkan, Sonnet mungkin sedikit ketinggalan berbanding Opus pada penanda aras penaakulan paling kompleks atau pelbagai disiplin.
Kes Penggunaan Representatif Claude Sonnet 4.6
- Bantuan Pangkalan Kod Besar: Sesuai untuk menyerap dan membuat penaakulan tentang keseluruhan sistem perisian, penstrukturan semula, atau kebergantungan rentas fail.
- Sintesis Dokumen & Penyelidikan: Berguna untuk analisis dokument panjang di mana konteks melebihi had tipikal.
- Automasi Aliran Kerja: Menyelesaikan tugas komputer berbilang langkah, seperti hamparan dan automasi borang.
- Kerja Pengetahuan Umum: Sesuai untuk pekerja pengetahuan yang memerlukan pematuhan arahan dan penaakulan yang boleh dipercayai tanpa kos model perdana.
Cara mengakses dan menggunakan API Claude Sonnet 4.6
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API bukti akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Langkah 2: Hantar Permintaan ke API claude-sonnet-4-6
Pilih titik akhir “claude-opus-4-6” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API di laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. Di mana untuk memanggilnya: format Anthropic Messages dan format Chat.
Masukkan soalan atau permintaan anda ke dalam medan kandungan — inilah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan membalas dengan status tugas dan data output.