Grok 3, model andalan terbaru xAI, merupakan lompatan maju dalam kemampuan model bahasa besar (LLM) dengan menggabungkan sumber daya komputasi yang besar, penalaran tingkat lanjut, input multimoda, dan akses data waktu nyata. Diluncurkan pada pertengahan Februari 2025, Grok 3 dibangun berdasarkan pendahulunya dengan fitur yang dirancang untuk pengembang, perusahaan, dan pengguna akhir di X Premium+, SuperGrok, dan segera melalui API perusahaan. Artikel ini mengeksplorasi spektrum penuh kemampuannya dan mengkaji implikasi praktis, etis, dan kompetitif dari peluncurannya.
Apa itu Grok 3 dan apa bedanya dengan pendahulunya?
Daya komputasi yang diperluas
Grok 3 dilatih pada superkluster Colossus milik xAI, yang menampilkan sekitar 200,000 GPU NVIDIA H100—sepuluh kali lipat komputasi Grok 2. Investasi perangkat keras yang besar ini memungkinkan model tersebut untuk menangani tugas penalaran yang lebih kompleks dan jendela konteks yang lebih besar daripada versi sebelumnya.
Peningkatan dataset dan pelatihan
Selain korpora teks skala web standar, data pelatihan Grok 3 mencakup sumber-sumber khusus seperti pengajuan hukum dan makalah ilmiah. xAI mengklaim bahwa kumpulan data yang diperluas ini mendukung kinerja unggulnya pada tolok ukur seperti American Invitational Mathematics Examination (AIME) dan GPQA untuk masalah sains tingkat PhD.
Versi mini untuk kebutuhan latensi rendah
Untuk melayani aplikasi yang sensitif terhadap latensi, xAI merilis Grok 3 Mini—varian ringan yang mengorbankan sebagian akurasi demi waktu respons yang lebih cepat. Tingkatan ini memungkinkan pengembang untuk memilih antara kinerja puncak dan penundaan inferensi minimal.
Kemampuan penalaran baru apa yang ditawarkan Grok 3?
Mode “Berpikir” untuk penalaran yang transparan
Grok 3 memperkenalkan tombol “Think” yang memperlihatkan perincian proses inferensinya langkah demi langkah. Pengguna dapat mengamati bagaimana model tersebut merangkai langkah-langkah logis, membuat pengambilan keputusannya lebih mudah ditafsirkan dan menumbuhkan kepercayaan dalam domain berisiko tinggi.
Mode “Otak Besar” untuk pemecahan masalah yang kompleks
Untuk tugas yang memerlukan komputasi intensif—seperti pembuktian matematika multi-langkah atau pembuatan kode yang rumit—dapat dialihkan ke mode “Big Brain”. Ini mengalokasikan sumber daya GPU tambahan secara dinamis, memastikan eksplorasi lebih mendalam terhadap solusi kandidat dengan mengorbankan waktu inferensi yang lebih lama.
Penerjemah kode terintegrasi
Tidak seperti banyak LLM yang memerlukan koneksi alat eksternal, LLM ini menyertakan penerjemah kode bawaan. Pengguna dapat mengirimkan potongan kode dalam bahasa seperti Python atau JavaScript dan menerima output yang dieksekusi, skrip yang di-debug, atau blok kode yang diterjemahkan, langsung dalam antarmuka obrolan.
Bagaimana Grok 3 mengintegrasikan fitur internet dan pencarian?
DeepSearch untuk konteks skala web
DeepSearch adalah agen AI yang menjelajahi internet dan X (sebelumnya Twitter) secara real time untuk menyusun ringkasan yang komprehensif dan terkini. Saat kueri menuntut informasi di luar batas pelatihannya, Grok 3 memanggil DeepSearch untuk mengambil dan menyaring sumber yang relevan, sehingga secara efektif mengaburkan batas antara mesin pencari dan LLM.
DeeperSearch: peningkatan daya ingat dan penalaran
Pada bulan Maret 2025, xAI meningkatkan DeepSearch menjadi DeeperSearch, memperluas cakrawala pencariannya dan menyematkan lapisan penalaran tambahan. Peningkatan ini memungkinkan Grok 3 untuk merekonsiliasi titik data yang saling bertentangan, mempertimbangkan kredibilitas sumber, dan menyajikan perspektif yang bernuansa tentang isu-isu yang kompleks.
Analisis tren dan sentimen waktu nyata
Grok 3 dapat menganalisis sentimen media sosial secara langsung, mendeteksi tren industri yang sedang berkembang, dan menghasilkan wawasan yang dapat ditindaklanjuti bagi para pemasar, jurnalis, dan analis. Dengan memanfaatkan kiriman publik X yang melimpah, Grok XNUMX dapat menghasilkan laporan tentang sikap konsumen, obrolan pasar saham, atau liputan peristiwa global saat peristiwa itu terjadi.
Fungsionalitas multimoda apa yang didukung?
Pemahaman dan pengeditan gambar
Grok 3 memproses masukan gambar untuk menjawab pertanyaan, mendeskripsikan pemandangan visual, dan bahkan melakukan penyuntingan gambar dasar. Pengguna dapat mengunggah foto, meminta modifikasi—seperti penghapusan latar belakang atau transformasi gaya—dan menerima hasil suntingan, menjadikan Grok 3 sebagai alternatif ringan untuk alat penyuntingan gambar khusus.
Mode suara yang akan datang untuk interaksi alami
Elon Musk mengumumkan bahwa Grok 3 akan segera mendukung antarmuka suara multimoda. Dalam beberapa minggu setelah peluncuran awal, pengguna akan dapat bercakap-cakap dengan Grok 3 secara lisan, memanfaatkan jalur komunikasi ucapan-ke-teks dan teks-ke-ucapan untuk menciptakan agen percakapan yang lancar di seluruh saluran audio dan teks.
Bagaimana Grok 3 Dapat Diakses oleh Pengguna dan Pengembang?
Tingkatan langganan apa yang mendukung Grok 3?
Awalnya diluncurkan untuk pelanggan X Premium+ dan SuperGrok xAI pada 17 Februari 2025, Grok 3 dibuka sebentar untuk pengguna gratis dalam waktu terbatas. Premium+ sekarang berharga USD 40/bulan (naik dari USD 22), sementara SuperGrok menawarkan akses prioritas ke mode penalaran dan hasil yang lebih tinggi.
Apa saja pilihan dan harga API yang tersedia?
Pada bulan April 2025, xAI meluncurkan API publiknya untuk Grok 3, yang menawarkan dua versi—standar dan mini—dengan kemampuan penalaran. Harga ditetapkan sebesar USD 3 per juta token input dan USD 15 per juta token yang dihasilkan, sehingga memposisikannya secara kompetitif terhadap tingkatan harga GPT-4 OpenAI.
Kontroversi dan Keterbatasan Apa Saja yang Menyelimuti Grok 3?
Kekhawatiran apa yang ada tentang misinformasi dan moderasi konten?
Iterasi Grok sebelumnya dikritik karena keluaran yang menyinggung dan kesalahan fakta yang kadang terjadi. Meskipun mode penalaran Grok 3 bertujuan untuk memeriksa fakta secara mandiri, moderasi konten tetap menjadi tantangan, terutama saat pengguna mengaktifkan mode dewasa yang "tanpa filter".
Pertimbangan etika apa yang muncul dari mode yang berorientasi pada orang dewasa?
Pada akhir Februari 2025, xAI meluncurkan beberapa 'mode' dewasa—"seksual," "tidak terkendali," dan "argumentatif"—yang mengizinkan bahasa dan tema eksplisit. Meskipun disebut-sebut sebagai cara menjaga privasi (dengan percakapan singkat), para kritikus memperingatkan bahwa mode ini dapat memungkinkan konten yang berbahaya atau eksploitatif jika tidak diawasi dengan ketat.
Kesimpulan
Grok 3 merupakan momen penting bagi xAI, yang memadukan skala komputasi yang belum pernah ada sebelumnya dengan penalaran yang kuat, pemahaman multimoda, dan akses data waktu nyata. Mode penalaran ganda dan agen DeepSearch-nya menunjukkan pendekatan baru terhadap transparansi AI dan kesegaran informasi, sementara integrasinya dengan X meletakkan dasar bagi agen percakapan yang tertanam dalam konteks media sosial. Meskipun demikian, kontroversi pembandingan, pergeseran harga, dan dilema etika—terutama di sekitar mode dewasa yang tidak difilter—menekankan kompleksitas penerapan AI yang mutakhir. Saat xAI bersiap untuk membuka sumber model sebelumnya dan memperluas cakrawala multimodanya, komunitas AI yang lebih luas akan mengamati dengan saksama untuk melihat apakah ia tidak hanya dapat bersaing dalam metrik tetapi juga membentuk masa depan interaksi yang digerakkan oleh AI.
Gunakan Grok 3 di CometAPI
API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda mengintegrasikan API Grok 3 (nama model: grok-3;grok-3-latest;), dan Anda akan mendapatkan $1 di akun Anda setelah mendaftar dan masuk! Selamat datang untuk mendaftar dan mencoba CometAPI.
Untuk memulai, jelajahi kemampuan model di Playground dan konsultasikan Panduan API untuk petunjuk terperinci. Perhatikan bahwa beberapa pengembang mungkin perlu memverifikasi organisasi mereka sebelum menggunakan model tersebut.
