API xem trước Gemini 3 Pro

CometAPI
AnnaDec 10, 2025
API xem trước Gemini 3 Pro

Gemini 3 Pro (Bản xem trước) là mô hình suy luận đa phương thức chủ lực mới nhất của Google/DeepMind trong dòng Gemini 3. Nó được định vị là "mô hình thông minh nhất từ ​​trước đến nay", được thiết kế cho suy luận sâu, quy trình làm việc của agent, mã hóa nâng cao và hiểu biết đa phương thức ngữ cảnh dài (tích hợp văn bản, hình ảnh, âm thanh, video, mã và công cụ).

Đặc tính nổi bật

  • Phương thức: Văn bản, hình ảnh, video, âm thanh, PDF (và đầu ra công cụ có cấu trúc).
  • Chất tác nhân/dụng cụ: Gọi hàm tích hợp, tìm kiếm như công cụ, thực thi mã, ngữ cảnh URL và hỗ trợ điều phối các tác nhân nhiều bước. Cơ chế chữ ký suy nghĩ bảo toàn suy luận nhiều bước trong các lệnh gọi.
  • Mã hóa & “mã hóa rung cảm”: Được tối ưu hóa cho việc tạo front-end, tạo giao diện người dùng tương tác và mã hóa agentic (nó đứng đầu các bảng xếp hạng liên quan do Google báo cáo). Nó được quảng cáo là mô hình "mã hóa rung cảm" mạnh nhất của họ từ trước đến nay.
  • Kiểm soát nhà phát triển mới: thinking_level (thấp|cao) để cân bằng giữa chi phí/độ trễ so với độ sâu của lý luận và media_resolution Kiểm soát độ trung thực đa phương thức trên mỗi hình ảnh hoặc khung hình video. Điều này giúp cân bằng hiệu suất, độ trễ và chi phí.

Hiệu suất điểm chuẩn

  • Gemini3Pro đạt vị trí đầu tiên trong LMARE với số điểm là 1501, vượt qua số điểm 1484 của Grok-4.1-thinking và cũng dẫn trước Claude Sonnet 4.5 và Opus 4.1.
  • Nó cũng đạt vị trí đầu tiên trong đấu trường lập trình WebDevArena với số điểm là 1487.
  • Trong kỳ thi lý luận học thuật Humanity's Last Exam, đạt 37.5% (không cần công cụ); trong kỳ thi khoa học GPQA Diamond, đạt 91.9%; và trong cuộc thi toán MathArena Apex, đạt 23.4%, lập kỷ lục mới.
  • Về khả năng đa phương thức, MMMU-Pro đạt 81%; và về khả năng hiểu video Video-MMMU đạt 87.6%.

API xem trước Gemini 3 Pro

Chi tiết kỹ thuật và kiến ​​trúc

  • Tham số “Mức độ suy nghĩ”: Gemini 3 phơi bày một thinking_level kiểm soát cho phép các nhà phát triển cân bằng giữa chiều sâu của lý luận nội bộ với độ trễ/chi phí. Mô hình xử lý thinking_level như một sự cho phép tương đối cho lý luận nhiều bước nội bộ hơn là một sự đảm bảo mã thông báo nghiêm ngặt. Mặc định thường là high dành cho Pro. Đây là một tính năng kiểm soát mới rõ ràng dành cho các nhà phát triển để điều chỉnh quy hoạch nhiều bước và chiều sâu của chuỗi suy nghĩ.
  • Đầu ra có cấu trúc và công cụ: Mô hình hỗ trợ đầu ra JSON có cấu trúc và có thể được kết hợp với các công cụ tích hợp (nền tảng Tìm kiếm của Google, ngữ cảnh URL, thực thi mã, v.v.). Một số tính năng của công cụ đầu ra có cấu trúc chỉ dành cho bản xem trước gemini-3-pro-preview.
  • Tích hợp đa phương thức và tác nhân: Gemini 3 Pro được xây dựng rõ ràng cho quy trình làm việc của tác nhân (công cụ + nhiều tác nhân trên mã/thiết bị đầu cuối/trình duyệt).
  • Chấp nhận đầu vào văn bản, hình ảnh, video, âm thanh và PDF; đầu ra văn bản.

Những hạn chế và lưu ý đã biết

  1. Không phải là sự thật hoàn hảo - ảo giác vẫn có thể xảy ra. Mặc dù Google tuyên bố đã cải thiện đáng kể tính xác thực, việc xác minh có căn cứ và đánh giá của con người vẫn cần thiết trong các bối cảnh có rủi ro cao (pháp lý, y tế, tài chính).
  2. Hiệu suất ngữ cảnh dài thay đổi tùy theo nhiệm vụ. Việc hỗ trợ cửa sổ đầu vào 1M là một khả năng khó khăn, nhưng hiệu quả thực nghiệm có thể giảm ở một số điểm chuẩn ở mức cực đại (sự suy giảm theo từng điểm được quan sát thấy ở 1M trong một số bài kiểm tra ngữ cảnh dài).
  3. Đánh đổi về chi phí và độ trễ. Bối cảnh lớn và cao hơn thinking_level cài đặt tăng khả năng tính toán, độ trễ và chi phí; các mức giá được áp dụng dựa trên khối lượng mã thông báo. Sử dụng thinking_level và chiến lược phân chia để quản lý chi phí.
  4. Bộ lọc an toàn và nội dung. Google tiếp tục áp dụng các chính sách an toàn và các lớp kiểm duyệt; một số nội dung và hành động vẫn bị hạn chế hoặc sẽ kích hoạt chế độ từ chối.

So sánh Gemini 3 Pro Preview với các mẫu máy hàng đầu khác

So sánh cấp cao (xem trước → định tính):

Chống lại Gemini 2.5 Pro: Những cải tiến đột phá về lập luận, sử dụng công cụ tác nhân và tích hợp đa phương thức; khả năng xử lý ngữ cảnh rộng hơn nhiều và khả năng hiểu dạng dài tốt hơn. DeepMind cho thấy những tiến bộ nhất quán trong lập luận học thuật, lập trình và các tác vụ đa phương thức.

Chống lại GPT-5.1 và Claude Sonnet 4.5 (như đã báo cáo): Trên bảng xếp hạng chuẩn của Google/DeepMind, Gemini 3 Pro được đánh giá là dẫn đầu về một số chỉ số đại lý, đa phương thức và ngữ cảnh dài (xem Terminal-Bench, MMMU-Pro, AIME). Kết quả so sánh sẽ khác nhau tùy theo tác vụ.


Các trường hợp sử dụng điển hình và có giá trị cao

  • Tóm tắt tài liệu/sách lớn & Hỏi & Đáp: hỗ trợ ngữ cảnh dài khiến nó trở nên hấp dẫn đối với các nhóm pháp lý, nghiên cứu và tuân thủ.
  • Hiểu và tạo mã ở quy mô kho lưu trữ: tích hợp với chuỗi công cụ mã hóa và lý luận cải tiến giúp cải thiện quy trình tái cấu trúc cơ sở mã lớn và quy trình đánh giá mã tự động.
  • Trợ lý sản phẩm đa phương thức: quy trình làm việc hình ảnh + văn bản + âm thanh (hỗ trợ khách hàng thu thập ảnh chụp màn hình, đoạn trích cuộc gọi và tài liệu).
  • Tạo và biên tập phương tiện truyền thông (ảnh → video): Các tính năng trước đó của gia đình Gemini hiện bao gồm khả năng chụp ảnh → quay video theo phong cách Veo / Flow; bản xem trước gợi ý khả năng tạo đa phương tiện sâu hơn cho các nguyên mẫu và quy trình làm việc truyền thông.

Cách gọi API gemini-3-pro-preview từ CometAPI

Giá xem trước Gemini 3 Pro trên CometAPI,giảm giá 20% so với giá chính thức:

Mã thông báo đầu vào$1.60
Mã thông báo đầu ra$9.60

Các bước cần thiết

  • Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước.
  • Đăng nhập vào Bảng điều khiển CometAPI.
  • Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.

API xem trước Gemini 3 Pro

Phương pháp sử dụng

  1. Chọn hàng**gemini-3-pro-preview**” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn.
  2. Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để nhận được câu trả lời đã tạo.

CometAPI cung cấp API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính về Chat:

Xem thêm API GPT-5.1

SHARE THIS BLOG

500+ Mô hình trong Một API

Giảm giá lên đến 20%