Pada awal tahun 2025, OpenAI meluncurkan dua model penting: GPT-4.5 dan seri O3. Sementara GPT-4.5, dengan nama kode "Orion," merupakan kemajuan dalam AI percakapan, model O3 dirancang untuk tugas penalaran dan pemecahan masalah yang kompleks. Artikel ini membahas kapabilitas, kinerja, dan aplikasi kedua model untuk menentukan model mana yang menonjol dalam lanskap AI saat ini.
Apa itu GPT-4.5
GPT-4.5 dirilis pada 27 Februari 2025, awalnya tersedia untuk pengguna dan pengembang ChatGPT Pro melalui API OpenAI. Rencana dibuat untuk memperluas akses ke pengguna ChatGPT Plus dan Team segera setelahnya.
Peningkatan Utama
GPT-4.5 dibangun berdasarkan pendahulunya, GPT-4, dengan beberapa peningkatan penting:
- Jendela Konteks yang Diperluas: Mendukung hingga 128,000 token, memungkinkan percakapan yang lebih luas dan koheren.
- Kemampuan Multimoda: Memperkenalkan dukungan untuk pemrosesan gambar, yang memungkinkan pengguna mengunggah dan menganalisis gambar bersama teks.
- Peningkatan Kecerdasan Emosional: Menawarkan interaksi yang lebih mirip manusia dengan lebih memahami dan merespons isyarat emosional.
- Mengurangi Tingkat Halusinasi: Menunjukkan pengurangan sebesar 37.1% dalam menghasilkan informasi yang salah atau dibuat-buat dibandingkan dengan model sebelumnya.
keterbatasan
Meskipun ada kemajuan ini, GPT-4.5 memiliki kekurangan:
- Biaya: Dengan harga $75 per juta token masukan dan $150 per juta token keluaran, ini secara signifikan lebih mahal daripada model seperti GPT-3.5 Turbo.
- Tantangan Penalaran:Beberapa pengguna melaporkan bahwa GPT-4.5 kesulitan dengan tugas penalaran yang rumit dan mungkin tidak konsisten mengikuti instruksi terperinci.
Apa itu O3
Rangkaian model O3 OpenAI menunjukkan pergeseran ke arah sistem AI yang mampu melakukan penalaran tingkat lanjut. Dengan memanfaatkan pembelajaran penguatan, model O3 dilatih untuk "berpikir" sebelum menghasilkan respons, menggunakan "rantai pemikiran pribadi" untuk merencanakan dan bernalar melalui tugas.
Fitur Utama OpenAI o3
1. Peningkatan Kemampuan Berpikir
Inti dari desain o3 adalah kemampuannya untuk melakukan penalaran logis langkah demi langkah. Hal ini dicapai melalui mekanisme "rantai pemikiran pribadi", yang memungkinkan model untuk berunding secara internal sebelum menghasilkan respons. Fitur tersebut memungkinkan o3 untuk menangani tugas-tugas rumit dalam matematika, pengodean, dan analisis ilmiah dengan akurasi yang lebih baik.
2. Kinerja Tolok Ukur yang Unggul
o3 telah menunjukkan kinerja yang luar biasa di beberapa benchmark:
- Berlian GPQA: Mencapai skor 87.7% pada pertanyaan sains tingkat ahli.
- Bangku SWE Terverifikasi: Mendapat skor 71.7% dalam menyelesaikan tugas rekayasa perangkat lunak dunia nyata, melampaui o1 yang hanya memperoleh 48.9%.
- Kekuatan kode: Meraih peringkat Elo sebesar 2727, yang menunjukkan kecakapan tinggi dalam tantangan pemrograman kompetitif.
- Tolok Ukur ARC-AGI: Menunjukkan akurasi tiga kali lipat dari o1 dalam tugas penalaran abstrak.
3. Kemampuan Multimoda
Selain teks, o3 menunjukkan keterampilan persepsi visual yang kuat. Ia dapat menganalisis gambar, bagan, dan grafik, sehingga ia mahir dalam tugas-tugas yang memerlukan penafsiran data visual.
4. Penggunaan Alat Otonom
o3 dilengkapi dengan kemampuan untuk secara mandiri memanfaatkan berbagai alat seperti penjelajahan web, eksekusi Python, pembuatan gambar, dan analisis berkas. Hal ini memungkinkan model untuk melakukan berbagai tugas tanpa perintah pengguna yang eksplisit, sehingga meningkatkan fleksibilitasnya.
5. Penyelarasan yang Disengaja demi Keselamatan
Untuk memastikan keluaran yang andal dan aman, o3 menggabungkan pendekatan penyelarasan yang disengaja. Metode ini meningkatkan kapasitas model untuk mematuhi pedoman keselamatan melalui proses penalaran terstruktur.
6. Varian untuk Berbagai Kebutuhan
OpenAI telah merilis o3 dalam beberapa versi untuk memenuhi persyaratan yang berbeda:
- o3-mini: Model yang lebih kecil dan hemat biaya yang dioptimalkan untuk kecepatan dan ketepatan dalam domain teknis.
- o3-mini-tinggi: Varian o3-mini yang mengalokasikan lebih banyak sumber daya komputasi untuk penalaran yang lebih baik, tersedia untuk pelanggan berbayar.
Pertimbangan dan Keterbatasan
Meskipun o3 menunjukkan kemajuan yang signifikan, namun bukan tanpa tantangan:
- Meningkatnya Permintaan Komputasi: Proses pertimbangan model memerlukan daya komputasi yang lebih besar, yang mengakibatkan biaya operasional yang lebih tinggi dan potensi latensi dalam respons.
- Ketidakpastian dalam Output: Meskipun ada perbaikan, o3 dapat menunjukkan ketidakkonsistenan, seperti halusinasi atau kesalahan dalam tugas tertentu, yang mencerminkan tantangan yang lebih luas dalam pengembangan AI.
Analisis Perbandingan: GPT-4.5 vs. O3
Pemrosesan Bahasa Alami dan Kreativitas
ChatGPT-4.5 unggul dalam menghasilkan respons yang kreatif dan kaya konteks, sehingga ideal untuk aplikasi dalam penceritaan, layanan pelanggan, dan perencanaan strategis. Kecerdasan emosionalnya yang ditingkatkan memungkinkan interaksi yang lebih bernuansa.
Sebaliknya, OpenAI o3 mengutamakan penalaran logis daripada ekspresi kreatif. Meskipun mungkin tidak cocok dengan ChatGPT-4.5 dalam hal gaya percakapan, pendekatan terstrukturnya memastikan keakuratan dalam tugas yang memerlukan analisis terperinci.
Penalaran dan Pemecahan Masalah
OpenAI o3 mengungguli ChatGPT-4.5 dalam ranah teknis. Kemampuannya untuk berunding secara internal menghasilkan akurasi yang lebih tinggi dalam pengkodean, matematika, dan pemecahan masalah ilmiah. Misalnya, o3 memperoleh skor 71.7% pada tolok ukur SWE-bench Verified, yang menilai kemampuan rekayasa perangkat lunak.
ChatGPT-4.5, meskipun kompeten, mungkin tidak menyamai presisi o3 di area ini. Kekuatannya lebih terletak pada pengetahuan umum dan tugas-tugas kreatif daripada pemecahan masalah teknis yang terspesialisasi.
Biaya dan Aksesibilitas
ChatGPT-4.5 diposisikan sebagai penawaran premium, dengan biaya $75 per juta token input dan $150 per juta token output. Harga tersebut mencerminkan kemampuan tingkat lanjutnya tetapi mungkin mahal bagi sebagian pengguna. Akses saat ini terbatas pada pelanggan ChatGPT Pro dan klien perusahaan, dengan rencana ketersediaan yang lebih luas.
O3 diposisikan sebagai penawaran premium, dengan biaya $10 per juta token input dan $40 per juta token output, $2.5 per juta input yang di-cache, fokusnya pada efisiensi komputasi menunjukkan solusi yang lebih hemat biaya untuk tugas-tugas yang memerlukan penalaran logis. Desainnya bertujuan untuk menyeimbangkan kinerja dengan pemanfaatan sumber daya, yang berpotensi menawarkan opsi yang lebih mudah diakses untuk aplikasi teknis.
Kesimpulan: Memilih Model yang Tepat
Keputusan antara GPT-4.5 dan O3 bergantung pada kebutuhan spesifik pengguna:
- Untuk Percakapan Alami: GPT-4.5 lebih disukai untuk aplikasi yang membutuhkan interaksi seperti manusia dan kecerdasan emosional.
- Untuk Tugas Penalaran Kompleks: O3 lebih cocok untuk tugas yang melibatkan pemecahan masalah tingkat lanjut, pengkodean, dan penelitian ilmiah.
Seiring terus berkembangnya AI, integrasi kelancaran percakapan dan penalaran mendalam dalam model masa depan dapat menjembatani kesenjangan antara GPT-4.5 dan O3, menawarkan solusi komprehensif di berbagai domain.
Mulai
Pengembang dapat mengakses API GPT-4.5 dan API O3 melalui API KometUntuk memulai, jelajahi kemampuan model di Playground dan konsultasikan Panduan API untuk petunjuk terperinci. Perhatikan bahwa beberapa pengembang mungkin perlu memverifikasi organisasi mereka sebelum menggunakan model tersebut.
GPT-4.5 API and O3 API Harga di CometAPI, diskon 20% dari harga resmi:
| Versi Model | GPT-4.5 | O3 |
| Harga di CometAPI | Token Masukan: $60 / M token | o3-mini-all : Token Masukan: $0.88 / Jt token Token Keluaran: $3.52 / M token o3-mini-high:Harga: $0.06 o3-mini-high-all: Harga: $0.06 |
| Token Keluaran: $120 / M token | o3-2025-04-16 : Token Masukan: $8 / Jt token Token Keluaran: $32 / M token | |
| nama model | gpt-4.5-preview-2025-02-27 gpt-4.5-preview gpt-4.5 | o3 o3-2025-04-16 |
