Thông số kỹ thuật — Gemini 3.1 Pro
| Hạng mục | gemini-3-pro (tóm tắt công khai) |
|---|---|
| Nhà cung cấp | |
| ID mô hình chuẩn | gemini-3-pro (bản xem trước công khai) |
| Loại đầu vào | Văn bản, Hình ảnh, Video, Âm thanh, PDF |
| Loại đầu ra | Văn bản (ngôn ngữ tự nhiên, đầu ra có cấu trúc, payload cho lời gọi hàm) |
| Giới hạn token đầu vào (ngữ cảnh) | 1,048,576 token |
| Giới hạn token đầu ra | 65,536 token |
| Gọi hàm / sử dụng công cụ | Được hỗ trợ (gọi hàm, đầu ra có cấu trúc, tích hợp công cụ) |
| Đa phương thức | Hỗ trợ đa phương thức đầy đủ (hình ảnh, video, âm thanh, tài liệu) |
| Thực thi mã & luồng tác tử | Được hỗ trợ (chế độ tác tử, hỗ trợ mã, điều phối công cụ) |
| Mốc kiến thức | Tháng 1 năm 2025 |
Gemini 3.1 Pro là gì?
Gemini 3.1 Pro là flagship công khai của Google trong dòng Gemini 3, được định vị là mô hình suy luận đa phương thức tối tân với công cụ tác tử và công cụ dành cho nhà phát triển nâng cao. Mô hình nhấn mạnh khả năng xử lý ngữ cảnh dung lượng lớn (đầu vào trên 1M token), hỗ trợ phương tiện rộng (hình ảnh, video, âm thanh, PDF), và tích hợp sâu cho việc sử dụng công cụ, gọi hàm, cùng các quy trình công việc hướng mã (ví dụ: Gemini Code Assist và các chế độ tác tử).
Gemini 3 Pro được Google giới thiệu là tối ưu cho cả trải nghiệm nhà phát triển tương tác (lập trình độ trễ thấp và quy trình tác tử) và khả năng hiểu đa phương thức độ trung thực cao (diễn giải và suy luận trên các đầu vào đa phương tiện hỗn hợp).
Tính năng chính của Gemini 3.1 Pro
Gemini-3.1 Pro (thông qua bản xem trước) giới thiệu các tính năng sau:
Tích hợp đa phương thức
Xử lý đầu vào từ:
- Ngôn ngữ tự nhiên
- Hình ảnh
- Giọng nói/âm thanh
- Video
với biểu diễn token thống nhất để suy luận xuyên phương thức.
Cửa sổ ngữ cảnh mở rộng
Dung lượng ngữ cảnh cực lớn lên tới ~1 triệu token cho phép xử lý:
- Tài liệu dài
- Tổng hợp đa tài liệu
- Cơ sở mã và bản ghi.
Điều này vượt qua nhiều mô hình cạnh tranh vốn thường chỉ hỗ trợ ~32 K–262 K token.
Mở rộng Sparse Mixture-of-Experts (MoE)
Định tuyến MoE thưa (Sparse) cho phép mở rộng dung lượng nội tại của mô hình mà không tăng chi phí tính toán tương ứng, cải thiện khả năng suy luận ở quy mô lớn.
Suy luận / Lập kế hoạch nâng cao
Các đổi mới như huấn luyện chuỗi suy nghĩ (chain-of-thought), học tăng cường từ phản hồi của con người và các bộ đo chuyên biệt giúp mô hình mạnh về các nhiệm vụ logic và toán học.
Các điểm chuẩn được cho là:
AIME 2025: 100% (kèm thực thi mã)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
Trường hợp sử dụng tiêu biểu cho doanh nghiệp
- Pipeline phương tiện đầu-cuối: Nạp video, bản chép lời và hình ảnh để tạo bản tóm tắt đồng bộ, siêu dữ liệu và insight có cấu trúc ở quy mô lớn.
- Tạo và rà soát mã quy mô lớn: Sử dụng trong IDE và pipeline CI để tự động sinh mã, tái cấu trúc dự án nhiều tệp và đề xuất bài kiểm thử trên các cơ sở mã lớn.
- Tự động hóa dựa trên tác tử: Điều phối các tác tử đa công cụ tương tác với dịch vụ đám mây, hệ thống điều phối và API nội bộ bằng lời gọi hàm có cấu trúc.
- Nghiên cứu & sản xuất nội dung: Soạn thảo nội dung dài (báo cáo, sách) kết hợp văn bản và đa phương tiện nhúng, đồng thời giữ nguyên các tham chiếu chéo nội bộ.
Cách truy cập API Gemini 3.1 Pro
Bước 1: Đăng ký lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API Gemini 3.1 Pro
Chọn endpoint “gemini-3.1-pro” để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. URL cơ sở là Gemini Generating Content và Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đó là phần mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.
Xem thêm Gemini 3 Pro API