Thông số kỹ thuật — Gemini 3.1 Pro

Hạng mục	gemini-3-pro (tóm tắt công khai)
Nhà cung cấp	Google
ID mô hình chuẩn	gemini-3-pro (bản xem trước công khai)
Loại đầu vào	Văn bản, Hình ảnh, Video, Âm thanh, PDF
Loại đầu ra	Văn bản (ngôn ngữ tự nhiên, đầu ra có cấu trúc, payload cho lời gọi hàm)
Giới hạn token đầu vào (ngữ cảnh)	1,048,576 token
Giới hạn token đầu ra	65,536 token
Gọi hàm / sử dụng công cụ	Được hỗ trợ (gọi hàm, đầu ra có cấu trúc, tích hợp công cụ)
Đa phương thức	Hỗ trợ đa phương thức đầy đủ (hình ảnh, video, âm thanh, tài liệu)
Thực thi mã & luồng tác tử	Được hỗ trợ (chế độ tác tử, hỗ trợ mã, điều phối công cụ)
Mốc kiến thức	Tháng 1 năm 2025

Gemini 3.1 Pro là gì?

Gemini 3.1 Pro là flagship công khai của Google trong dòng Gemini 3, được định vị là mô hình suy luận đa phương thức tối tân với công cụ tác tử và công cụ dành cho nhà phát triển nâng cao. Mô hình nhấn mạnh khả năng xử lý ngữ cảnh dung lượng lớn (đầu vào trên 1M token), hỗ trợ phương tiện rộng (hình ảnh, video, âm thanh, PDF), và tích hợp sâu cho việc sử dụng công cụ, gọi hàm, cùng các quy trình công việc hướng mã (ví dụ: Gemini Code Assist và các chế độ tác tử).

Gemini 3 Pro được Google giới thiệu là tối ưu cho cả trải nghiệm nhà phát triển tương tác (lập trình độ trễ thấp và quy trình tác tử) và khả năng hiểu đa phương thức độ trung thực cao (diễn giải và suy luận trên các đầu vào đa phương tiện hỗn hợp).

Tính năng chính của Gemini 3.1 Pro

Gemini-3.1 Pro (thông qua bản xem trước) giới thiệu các tính năng sau:

Tích hợp đa phương thức

Xử lý đầu vào từ:

Ngôn ngữ tự nhiên
Hình ảnh
Giọng nói/âm thanh
Video

với biểu diễn token thống nhất để suy luận xuyên phương thức.

Cửa sổ ngữ cảnh mở rộng

Dung lượng ngữ cảnh cực lớn lên tới ~1 triệu token cho phép xử lý:

Tài liệu dài
Tổng hợp đa tài liệu
Cơ sở mã và bản ghi.

Điều này vượt qua nhiều mô hình cạnh tranh vốn thường chỉ hỗ trợ ~32 K–262 K token.

Mở rộng Sparse Mixture-of-Experts (MoE)

Định tuyến MoE thưa (Sparse) cho phép mở rộng dung lượng nội tại của mô hình mà không tăng chi phí tính toán tương ứng, cải thiện khả năng suy luận ở quy mô lớn.

Suy luận / Lập kế hoạch nâng cao

Các đổi mới như huấn luyện chuỗi suy nghĩ (chain-of-thought), học tăng cường từ phản hồi của con người và các bộ đo chuyên biệt giúp mô hình mạnh về các nhiệm vụ logic và toán học.

Các điểm chuẩn được cho là:

AIME 2025: 100% (kèm thực thi mã)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%

Trường hợp sử dụng tiêu biểu cho doanh nghiệp

Pipeline phương tiện đầu-cuối: Nạp video, bản chép lời và hình ảnh để tạo bản tóm tắt đồng bộ, siêu dữ liệu và insight có cấu trúc ở quy mô lớn.
Tạo và rà soát mã quy mô lớn: Sử dụng trong IDE và pipeline CI để tự động sinh mã, tái cấu trúc dự án nhiều tệp và đề xuất bài kiểm thử trên các cơ sở mã lớn.
Tự động hóa dựa trên tác tử: Điều phối các tác tử đa công cụ tương tác với dịch vụ đám mây, hệ thống điều phối và API nội bộ bằng lời gọi hàm có cấu trúc.
Nghiên cứu & sản xuất nội dung: Soạn thảo nội dung dài (báo cáo, sách) kết hợp văn bản và đa phương tiện nhúng, đồng thời giữ nguyên các tham chiếu chéo nội bộ.

Cách truy cập API Gemini 3.1 Pro

Bước 1: Đăng ký lấy API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API Gemini 3.1 Pro

Chọn endpoint “gemini-3.1-pro” để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. URL cơ sở là Gemini Generating Content và Chat.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đó là phần mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Xem thêm Gemini 3 Pro API