技术规格 — Gemini 3.1 Pro
| 项目 | gemini-3-pro(公开摘要) |
|---|---|
| 提供方 | |
| 规范模型 ID | gemini-3-pro(公开预览) |
| 输入类型 | 文本、图像、视频、音频、PDF |
| 输出类型 | 文本(自然语言、结构化输出、函数调用载荷) |
| 输入 token 上限(上下文) | 1,048,576 tokens |
| 输出 token 上限 | 65,536 tokens |
| 函数调用/工具使用 | 支持(函数调用、结构化输出、工具集成) |
| 多模态能力 | 完整多模态支持(图像、视频、音频、文档) |
| 代码执行与智能体流程 | 支持(Agent 模式、代码助理、工具编排) |
| 知识截止 | 2025 年 1 月 |
什么是 Gemini 3.1 Pro?
Gemini 3.1 Pro 是 Google 在 Gemini 3 系列中面向公众的旗舰模型,被定位为最先进的多模态推理模型,具备先进的智能体与开发者工具能力。该模型强调高容量的上下文处理能力(超过 1M token 的输入)、广泛的媒体支持(图像、视频、音频、PDF),以及与工具使用、函数调用和代码中心化工作流(例如 Gemini Code Assist 与智能体模式)的深度集成。
Google 将 Gemini 3 Pro 描述为既针对交互式开发者体验(低延迟编码与智能体工作流)优化,也面向高保真多模态理解(对混合媒体输入进行解读与推理)优化。
Gemini 3.1 Pro 的主要功能
Gemini-3.1 Pro(通过其预览版)引入了以下功能:
多模态集成
可处理以下输入:
- 自然语言
- 图像
- 语音/音频
- 视频
并采用统一的 token 表示以支持跨模态推理。
扩展上下文窗口
高达 ~1 million tokens 的超大上下文容量,使其能够处理:
- 长文档
- 多文档综合
- 代码库与转录内容。
这超过了许多竞争模型(通常仅支持 ~32 K–262 K tokens)。
稀疏专家混合(MoE)扩展
稀疏 MoE 路由允许在不成比例增加计算成本的情况下扩展模型内部容量,从而在大规模下提升推理能力。
高级推理/规划
诸如思维链训练、人类反馈强化学习以及专项基准等创新,使其在逻辑与数学任务上表现出色。
据称的基准测试:
AIME 2025:100%(启用代码执行)
SWE-Bench Verified:83.9%
ARC-AGI-2:71.8%
LiveCodeBench Pro:2844 Elo
Terminal-Bench 2.0:63.5%
MMMLU:93.6%
典型企业级用例
- 端到端媒体管线:摄取视频、转录与图像,在规模化场景下生成同步的摘要、元数据与结构化洞察。
- 大规模代码生成与审查:在 IDE 与 CI 流水线中自动生成代码、重构多文件项目,并为大型代码库提供测试建议。
- 智能体自动化:使用结构化函数调用协调多工具智能体,与云服务、编排系统和内部 API 交互。
- 研究与内容生产:起草长篇内容(报告、书籍),结合文本与嵌入式多媒体,并保留内部交叉引用。
如何访问 Gemini 3.1 Pro API
步骤 1:注册获取 API 密钥
登录 cometapi.com。若您尚未成为我们的用户,请先注册。登录您的 CometAPI 控制台。获取该接口的访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取令牌 key:sk-xxxxx 并提交。
步骤 2:向 Gemini 3.1 Pro API 发送请求
选择“gemini-3.1-pro”端点发送 API 请求并设置请求体。请求方法与请求体可从我们网站的 API 文档获取。我们的网站还提供 Apifox 测试,方便您使用。将 <YOUR_API_KEY> 替换为您帐户中的实际 CometAPI key。基础 URL 为 Gemini 生成内容 和 聊天。
将您的问题或请求插入 content 字段——模型将对此作出响应。处理 API 响应以获取生成的答案。
步骤 3:检索并验证结果
处理 API 响应以获取生成的答案。处理完成后,API 将返回任务状态和输出数据。