Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
Masukan:$1.60/M
Keluaran:$9.60/M
Konteks:200.0k
Keluaran Maksimum:200.0k
Gemini 3 Pro Preview เป็นโมเดลอเนกประสงค์ในตระกูล Gemini ที่เปิดให้พรีวิวสำหรับการประเมินและการสร้างต้นแบบ รองรับการทำตามคำสั่ง การให้เหตุผลแบบหลายรอบ และงานด้านโค้ดและข้อมูล พร้อมเอาต์พุตแบบมีโครงสร้างและการเรียกใช้เครื่องมือ/ฟังก์ชันเพื่อทำเวิร์กโฟลว์ให้เป็นอัตโนมัติ การใช้งานทั่วไปได้แก่ ผู้ช่วยแชต การสรุปและการเขียนใหม่ การถามตอบที่เสริมด้วยการค้นคืนข้อมูล การสกัดข้อมูล และความช่วยเหลือด้านการเขียนโค้ดแบบเบาสำหรับแอปและบริการต่างๆ จุดเด่นด้านเทคนิคประกอบด้วยการปรับใช้ผ่าน API การตอบกลับแบบสตรีม การควบคุมด้านความปลอดภัย และความพร้อมสำหรับการผสานการทำงาน โดยมีความสามารถแบบมัลติโหมดที่ขึ้นอยู่กับการกำหนดค่าพรีวิว
Gambaran Keseluruhan
Playground
Ciri-ciri
Harga
API
Versi

Gemini 3 Pro (Preview) ialah model penaakulan multimodal utama terbaharu Google/DeepMind dalam keluarga Gemini 3. Ia diposisikan sebagai “model paling pintar mereka setakat ini,” direka untuk penaakulan mendalam, aliran kerja berasaskan ejen, pengkodan lanjutan, dan pemahaman multimodal berkonteks panjang (teks, imej, audio, video, kod dan integrasi alat).

Ciri utama

  • Modaliti: Teks, imej, video, audio, PDF (dan output alat berstruktur).
  • Berasaskan ejen/alatan: Pemanggilan fungsi terbina dalam, carian sebagai alat, pelaksanaan kod, konteks URL, dan sokongan untuk menyelaras ejen berbilang langkah. Mekanisme thought-signature mengekalkan penaakulan berbilang langkah merentas panggilan.
  • Pengkodan & “vibe coding”: Dioptimumkan untuk penjanaan front-end, penjanaan UI interaktif, dan pengkodan berasaskan ejen (ia mendahului papan pendahulu berkaitan yang dilaporkan oleh Google). Ia dipasarkan sebagai model “vibe-coding” mereka yang paling kuat setakat ini.
  • Kawalan pembangun baharu: thinking_level (low|high) untuk menukar timbal balik kos/latensi vs kedalaman penaakulan, dan media_resolution mengawal kesetiaan multimodal bagi setiap imej atau bingkai video. Ini membantu mengimbangi prestasi, latensi dan kos.

Prestasi penanda aras

  • Gemini3Pro meraih tempat pertama dalam LMARE dengan skor 1501, mengatasi 1484 mata Grok-4.1-thinking dan turut mendahului Claude Sonnet 4.5 serta Opus 4.1.
  • Ia juga meraih tempat pertama dalam arena pengaturcaraan WebDevArena dengan skor 1487.
  • Dalam Humanity’s Last Exam (penaakulan akademik), ia mencapai 37.5% (tanpa alat); dalam GPQA Diamond (sains), 91.9%; dan dalam pertandingan matematik MathArena Apex, 23.4%, menetapkan rekod baharu.
  • Dalam keupayaan multimodal, MMMU-Pro mencapai 81%; dan dalam pemahaman video Video-MMMU, 87.6%.

imej

Butiran teknikal & seni bina

  • Parameter “Thinking level”: Gemini 3 mendedahkan kawalan thinking_level yang membolehkan pembangun menukar kedalaman penaakulan dalaman berbanding latensi/kos. Model memperlakukan thinking_level sebagai peruntukan relatif untuk penaakulan dalaman berbilang langkah, bukannya jaminan token yang ketat. Lalai lazimnya high untuk Pro. Ini ialah kawalan baharu yang jelas bagi pembangun untuk melaras perancangan berbilang langkah dan kedalaman rantaian pemikiran.
  • Output berstruktur & alat: Model menyokong output JSON berstruktur dan boleh digabungkan dengan alat terbina dalam (Google Search grounding, konteks URL, pelaksanaan kod, dsb.). Sesetengah ciri gabungan output berstruktur+alat adalah khusus pratonton untuk gemini-3-pro-preview.
  • Integrasi multimodal dan berasaskan ejen: Gemini 3 Pro dibina khusus untuk aliran kerja berasaskan ejen (alatan + berbilang ejen merentas kod/terminal/pelayar).

Batasan & peringatan yang diketahui

  1. Ketepatan fakta tidak sempurna — halusinasi masih boleh berlaku. Walaupun terdapat penambahbaikan ketepatan fakta yang kukuh seperti yang didakwa Google, pengesahan berasaskan sumber dan semakan manusia masih diperlukan dalam senario berisiko tinggi (perundangan, perubatan, kewangan).
  2. Prestasi konteks panjang berbeza mengikut tugas. Sokongan untuk tetingkap input 1M ialah keupayaan teras, namun keberkesanan empirik boleh menurun pada sesetengah penanda aras pada panjang ekstrem (diperhatikan penurunan setempat pada 1M dalam beberapa ujian konteks panjang).
  3. Pertukaran kos & latensi. Konteks besar dan tetapan thinking_level lebih tinggi meningkatkan pengiraan, latensi dan kos; peringkat harga terpakai berdasarkan volum token. Guna thinking_level dan strategi pemecahan untuk mengurus kos.
  4. Keselamatan & penapis kandungan. Google terus menerapkan dasar keselamatan dan lapisan pemoderasian; kandungan dan tindakan tertentu kekal terhad atau akan mencetuskan mod penolakan.

Perbandingan Gemini 3 Pro Preview dengan model teratas lain

Perbandingan peringkat tinggi (pratonton → kualitatif):

Berbanding Gemini 2.5 Pro: Peningkatan besar dalam penaakulan, penggunaan alat berasaskan ejen, dan integrasi multimodal; pengendalian konteks yang jauh lebih besar dan pemahaman bentuk panjang yang lebih baik. DeepMind menunjukkan peningkatan konsisten merentas penaakulan akademik, pengkodan, dan tugasan multimodal.

Berbanding GPT-5.1 dan Claude Sonnet 4.5 (seperti yang dilaporkan): Pada set penanda aras Google/DeepMind, Gemini 3 Pro ditampilkan mendahului beberapa metrik agenik, multimodal, dan konteks panjang (lihat Terminal-Bench, MMMU-Pro, AIME). Keputusan perbandingan berbeza mengikut tugas.


Kes penggunaan tipikal dan bernilai tinggi

  • Ringkasan dokumen/buku berskala besar & Soal Jawab: sokongan konteks panjang menjadikannya menarik untuk pasukan perundangan, penyelidikan dan pematuhan.
  • Pemahaman & penjanaan kod pada skala repo: integrasi dengan rantaian alat pengkodan dan penaakulan yang dipertingkat membantu pembaharuan pangkalan kod besar dan aliran kerja semakan kod automatik.
  • Pembantu produk multimodal: aliran kerja imej + teks + audio (sokongan pelanggan yang memasukkan tangkapan skrin, petikan panggilan, dan dokumen).
  • Penjanaan & penyuntingan media (foto → video): ciri keluarga Gemini terdahulu kini merangkumi keupayaan foto→video gaya Veo / Flow; pratonton mencadangkan penjanaan multimedia yang lebih mendalam untuk prototaip dan aliran kerja media.

Playground untuk Gemini 3 Pro Preview

Terokai Playground Gemini 3 Pro Preview — persekitaran interaktif untuk menguji model dan menjalankan pertanyaan dalam masa nyata. Cuba prompt, laraskan parameter, dan ulangi serta-merta untuk mempercepatkan pembangunan dan mengesahkan kes penggunaan.

Ciri-ciri untuk Gemini 3 Pro Preview

* **ID model (pratonton):** `gemini-3-pro-preview`. * **Jenis input:** Teks, Imej, Video, Audio, PDF. Output: Teks * **Had konteks/token:** Input ≈ **1,048,576 token**; Output ≤ **65,536 token**. * **Pengetahuan setakat:** **Januari 2025** (menggunakan Search Grounding untuk maklumat yang lebih baharu). * **Keupayaan (terpilih):** pemanggilan fungsi, pelaksanaan kod, carian fail, output berstruktur, search grounding. Tidak disokong: penjanaan audio, penjanaan imej, API langsung, segmentasi imej, Google Maps grounding (sesetengah ciri berbeza daripada Gemini 2.5).
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Harga untuk Gemini 3 Pro Preview

Terokai harga yang kompetitif untuk Gemini 3 Pro Preview, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Gemini 3 Pro Preview boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)
Masukan:$1.60/M
Keluaran:$9.60/M
Masukan:$2.00/M
Keluaran:$12.00/M

Kod contoh dan API untuk Gemini 3 Pro Preview

Gemini 3 Pro ialah model penaakulan multimodal perdana terbaharu Google/DeepMind dalam keluarga Gemini 3. Ia diposisikan sebagai “model paling pintar setakat ini”, direka untuk penaakulan mendalam, aliran kerja berasaskan ejen, pengaturcaraan lanjutan, dan pemahaman multimodal berkonteks panjang (teks, imej, audio, video, kod dan penyepaduan alat).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versi Gemini 3 Pro Preview

Sebab Gemini 3 Pro Preview mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.