Thông số kỹ thuật — Gemini 3.1 Pro
| Hạng mục | gemini-3-pro (tóm tắt công khai) |
|---|---|
| Nhà cung cấp | |
| ID mô hình chuẩn | gemini-3-pro (bản xem trước công khai) |
| Loại đầu vào | Văn bản, Hình ảnh, Video, Âm thanh, PDF |
| Loại đầu ra | Văn bản (ngôn ngữ tự nhiên, đầu ra có cấu trúc, payload cho lời gọi hàm) |
| Giới hạn token đầu vào (ngữ cảnh) | 1,048,576 tokens |
| Giới hạn token đầu ra | 65,536 tokens |
| Gọi hàm / sử dụng công cụ | Hỗ trợ (gọi hàm, đầu ra có cấu trúc, tích hợp công cụ) |
| Đa phương thức | Hỗ trợ đa phương thức đầy đủ (hình ảnh, video, âm thanh, tài liệu) |
| Thực thi mã & luồng tác tử | Hỗ trợ (chế độ tác tử, hỗ trợ mã, điều phối công cụ) |
| Mốc kiến thức | Tháng 1 năm 2025 |
Gemini 3.1 Pro là gì?
Gemini 3.1 Pro là mô hình chủ lực công khai của Google trong gia đình Gemini 3, được định vị là mô hình suy luận đa phương thức tối tân với khả năng tác tử nâng cao và bộ công cụ dành cho nhà phát triển. Mô hình nhấn mạnh khả năng xử lý ngữ cảnh dung lượng lớn (đầu vào hơn 1M token), hỗ trợ đa phương tiện rộng (hình ảnh, video, âm thanh, PDF), và tích hợp sâu cho việc sử dụng công cụ, gọi hàm, cùng các quy trình tập trung vào mã (ví dụ: Gemini Code Assist và chế độ tác tử).
Gemini 3 Pro được Google giới thiệu là tối ưu cho cả trải nghiệm nhà phát triển tương tác (mã hóa độ trễ thấp và quy trình tác tử) lẫn khả năng hiểu đa phương thức có độ chính xác cao (diễn giải và suy luận trên nhiều loại phương tiện kết hợp).
Các tính năng chính của Gemini 3.1 Pro
Gemini-3.1 Pro (thông qua bản xem trước) giới thiệu các tính năng sau:
Tích hợp đa phương thức
Xử lý đầu vào từ:
- Ngôn ngữ tự nhiên
- Hình ảnh
- Giọng nói/âm thanh
- Video
với biểu diễn token thống nhất cho suy luận xuyên phương thức.
Cửa sổ ngữ cảnh mở rộng
Dung lượng ngữ cảnh cực lớn lên đến ~1 triệu token cho phép xử lý:
- Tài liệu dài
- Tổng hợp đa tài liệu
- Mã nguồn và bản ghi.
Điều này vượt qua nhiều mô hình cạnh tranh vốn thường chỉ hỗ trợ ~32 K–262 K token.
Mở rộng Hỗn hợp chuyên gia thưa (MoE)
Định tuyến MoE thưa cho phép mở rộng dung lượng nội bộ của mô hình mà không tăng chi phí tính toán tương ứng, cải thiện khả năng suy luận ở quy mô.
Suy luận / Lập kế hoạch nâng cao
Các đổi mới như huấn luyện chain-of-thought, học tăng cường từ phản hồi của con người và các bộ điểm chuẩn chuyên biệt giúp mô hình mạnh ở các tác vụ logic và toán học.
Điểm chuẩn được cho là:
AIME 2025: 100% (có thực thi mã)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
Trường hợp sử dụng tiêu biểu trong doanh nghiệp
- Pipeline phương tiện đầu-cuối: Nạp video, bản chép lời và hình ảnh để tạo bản tóm tắt đồng bộ, siêu dữ liệu và insight có cấu trúc ở quy mô lớn.
- Sinh và rà soát mã quy mô lớn: Sử dụng trong IDE và các pipeline CI để tự động sinh mã, tái cấu trúc dự án đa tệp, và đưa ra gợi ý kiểm thử trên các codebase lớn.
- Tự động hóa tác tử: Phối hợp các tác tử đa công cụ tương tác với dịch vụ đám mây, hệ thống điều phối và API nội bộ thông qua lời gọi hàm có cấu trúc.
- Nghiên cứu & sản xuất nội dung: Soạn thảo nội dung dài (báo cáo, sách) kết hợp văn bản và đa phương tiện nhúng, đồng thời giữ nguyên tham chiếu chéo nội bộ.
Cách truy cập API Gemini 3.1 Pro
Bước 1: Đăng ký lấy Khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, nhận khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu đến Gemini 3.1 Pro API
Chọn endpoint “gemini-3.1-pro” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url là Tạo nội dung Gemini và Trò chuyện.
Điền câu hỏi hoặc yêu cầu của bạn vào trường nội dung — đó là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để nhận câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để nhận câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.
Xem thêm Gemini 3 Pro API