Gemini 3 Pro Preview API

CometAPI
AnnaNov 17, 2025
Gemini 3 Pro Preview API

Gemini 3 Pro (Preview) là mô hình suy luận đa phương thức chủ lực mới nhất của Google/DeepMind trong gia đình Gemini 3. Nó được định vị là “mô hình thông minh nhất của họ cho đến nay”, được thiết kế cho suy luận sâu, quy trình tác tử (agentic), lập trình nâng cao và hiểu đa phương thức với ngữ cảnh dài (văn bản, hình ảnh, âm thanh, video, mã và tích hợp công cụ).

Tính năng chính

  • Các phương thức: Văn bản, hình ảnh, video, âm thanh, PDF (và đầu ra công cụ có cấu trúc).
  • Tác tử/công cụ: Tích hợp sẵn function calling, search-as-tool, thực thi mã, ngữ cảnh URL và hỗ trợ điều phối tác tử đa bước. Cơ chế thought-signature giúp bảo toàn suy luận đa bước giữa các lần gọi.
  • Lập trình & “vibe coding”: Tối ưu cho sinh front-end, tạo UI tương tác và lập trình tác tử (đứng đầu các bảng xếp hạng liên quan do Google báo cáo). Được quảng bá là mô hình “vibe-coding” mạnh nhất của họ tới nay.
  • Điều khiển mới cho nhà phát triển: thinking_level (low|high) để cân bằng chi phí/độ trễ với độ sâu suy luận, và media_resolution để điều chỉnh độ trung thực đa phương thức theo từng ảnh hoặc khung hình video. Những điều này giúp cân bằng hiệu năng, độ trễ và chi phí.

Hiệu năng trên benchmark

  • Gemini3Pro đạt hạng nhất trên LMARE với 1501 điểm, vượt qua Grok-4.1-thinking (1484 điểm) và dẫn trước Claude Sonnet 4.5 cùng Opus 4.1.
  • Cũng đạt hạng nhất trên sân chơi lập trình WebDevArena với 1487 điểm.
  • Ở Humanity’s Last Exam về suy luận học thuật, đạt 37.5% (không dùng công cụ); ở GPQA Diamond về khoa học, 91.9%; và ở cuộc thi toán MathArena Apex, 23.4%, lập kỷ lục mới.
  • Về đa phương thức, MMMU-Pro đạt 81%; và Video-MMMU về hiểu video đạt 87.6%.

Gemini 3 Pro Preview API

Chi tiết kỹ thuật & kiến trúc

  • Tham số “thinking level”: Gemini 3 cung cấp điều khiển thinking_level cho phép nhà phát triển cân bằng độ sâu suy luận nội bộ với độ trễ/chi phí. Mô hình xem thinking_level như một hạn mức tương đối cho lập kế hoạch đa bước nội bộ thay vì cam kết số token cứng. Mặc định thường là high với Pro. Đây là điều khiển mới để tinh chỉnh độ sâu lập kế hoạch nhiều bước và chuỗi suy nghĩ.
  • Đầu ra có cấu trúc & công cụ: Mô hình hỗ trợ structured JSON outputs và có thể kết hợp cùng các công cụ tích hợp (Google Search grounding, ngữ cảnh URL, thực thi mã, v.v.). Một số tính năng structured-output+công cụ hiện chỉ có ở dạng preview cho gemini-3-pro-preview.
  • Tích hợp đa phương thức và tác tử: Gemini 3 Pro được xây dựng rõ ràng cho quy trình tác tử (công cụ + nhiều tác tử trên code/terminal/trình duyệt).
  • Chấp nhận đầu vào văn bản, hình ảnh, video, âm thanh và PDF; đầu ra văn bản.

Hạn chế & điểm cần lưu ý

  1. Tính chính xác chưa hoàn hảo — vẫn có thể ảo tưởng. Dù Google cho biết đã cải thiện mạnh mẽ, xác minh có căn cứ và rà soát thủ công vẫn cần thiết trong các ngữ cảnh rủi ro cao (pháp lý, y tế, tài chính).
  2. Hiệu năng ngữ cảnh dài thay đổi theo tác vụ. Hỗ trợ cửa sổ đầu vào 1M là năng lực cứng, nhưng hiệu quả thực nghiệm có thể giảm ở một số bài kiểm tra khi đạt độ dài cực lớn (ghi nhận giảm điểm tại 1M ở một số bài kiểm tra ngữ cảnh dài).
  3. Đánh đổi chi phí & độ trễ. Ngữ cảnh lớn và đặt thinking_level cao làm tăng tính toán, độ trễ và chi phí; phân tầng giá áp dụng dựa trên số lượng token. Dùng thinking_level và chiến lược chia nhỏ để quản lý chi phí.
  4. Chính sách an toàn & bộ lọc nội dung. Google tiếp tục áp dụng chính sách an toàn và lớp kiểm duyệt; một số nội dung/hành động vẫn bị hạn chế hoặc kích hoạt chế độ từ chối.

So sánh Gemini 3 Pro Preview với các mô hình hàng đầu khác

So sánh cấp cao (preview → định tính):

So với Gemini 2.5 Pro: Cải thiện nhảy vọt về suy luận, sử dụng công cụ tác tử và tích hợp đa phương thức; xử lý ngữ cảnh lớn hơn và hiểu văn bản dài tốt hơn. DeepMind cho thấy tăng trưởng ổn định trên suy luận học thuật, lập trình và tác vụ đa phương thức.

So với GPT-5.1 và Claude Sonnet 4.5 (theo báo cáo): Trên bộ benchmark của Google/DeepMind, Gemini 3 Pro được trình bày là dẫn đầu ở nhiều chỉ số về tác tử, đa phương thức và ngữ cảnh dài (xem Terminal-Bench, MMMU-Pro, AIME). Kết quả so sánh thay đổi theo tác vụ.


Trường hợp sử dụng điển hình và giá trị cao

  • Tóm tắt & Hỏi-đáp tài liệu/sách lớn: hỗ trợ ngữ cảnh dài hấp dẫn với đội ngũ pháp lý, nghiên cứu và tuân thủ.
  • Hiểu & sinh mã ở quy mô kho: tích hợp với chuỗi công cụ lập trình và suy luận cải thiện giúp tái cấu trúc kho lớn và tự động rà soát mã.
  • Trợ lý sản phẩm đa phương thức: quy trình hình ảnh + văn bản + âm thanh (hỗ trợ khách hàng từ ảnh chụp màn hình, đoạn thoại và tài liệu).
  • Tạo & chỉnh sửa media (ảnh → video): các tính năng trước đây của dòng Gemini nay bao gồm khả năng kiểu Veo/Flow photo→video; bản preview gợi ý tạo đa phương tiện sâu hơn cho nguyên mẫu và quy trình media.

Cách gọi API gemini-3-pro-preview từ CometAPI

Gemini 3 Pro Preview Pricing in CometAPI, giảm 20% so với giá chính thức:

Token đầu vào$1.60
Token đầu ra$9.60

Các bước cần thiết

  • Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước.
  • Đăng nhập bảng điều khiển CometAPI console.
  • Lấy API key thông tin xác thực. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Gemini 3 Pro Preview API

Cách sử dụng

  1. Chọn endpoint “gemini-3-pro-preview” để gửi yêu cầu API và thiết lập request body. Phương thức và request body lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng.
  2. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đó là nội dung mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để lấy câu trả lời được tạo.

CometAPI cung cấp REST API tương thích hoàn toàn — giúp chuyển đổi liền mạch. Chi tiết chính cho Chat:

  • Base URL: v1/chat/completions
  • Model Names: gemini-3-pro-preview
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

Xem thêm GPT-5.1 API

Sẵn sàng giảm 20% chi phí phát triển AI?

Bắt đầu miễn phí trong vài phút. Bao gồm tín dụng dùng thử miễn phí. Không cần thẻ tín dụng.

Đọc thêm