Gemini 3 Pro (Preview) 是 Google/DeepMind 在 Gemini 3 系列中的全新旗舰多模态推理模型。其定位为“迄今最智能的模型”,面向深度推理、智能体工作流、先进编码以及长上下文多模态理解(文本、图像、音频、视频、代码与工具集成)。
关键特性
- 模态: 文本、图像、视频、音频、PDF(以及结构化工具输出)。
- 智能体/工具: 内置函数调用、将搜索作为工具、代码执行、URL 上下文,并支持编排多步智能体。Thought-signature 机制可在多次调用间保留多步推理。
- 编码与“vibe coding”:针对前端生成、交互式 UI 生成与智能体编码进行了优化(据 Google 报告在相关榜单中名列前茅)。被宣传为其迄今最强的“vibe-coding”模型。
- 全新的开发者控制项:
thinking_level(low|high) 可在成本/延迟与推理深度之间取舍,media_resolution可控制每张图像或视频帧的多模态保真度。两者有助于在性能、延迟与成本之间取得平衡。
基准测试表现
- Gemini3Pro 在 LMARE 取得 1501 分,位列第一,超过 Grok-4.1-thinking 的 1484 分,同时领先 Claude Sonnet 4.5 和 Opus 4.1。
- 在 WebDevArena 编程竞技场中以 1487 分获得第一名。
- 在 Humanity’s Last Exam 学术推理中取得 37.5%(无工具);在 GPQA Diamond 科学中为 91.9%;在 MathArena Apex 数学竞赛中为 23.4%,创下新纪录。
- 在多模态能力方面,MMMU-Pro 达到 81%;在 Video-MMMU 视频理解中达到 87.6%。
技术细节与架构
- “Thinking level” 参数: Gemini 3 暴露了
thinking_level控制项,允许开发者在内部推理深度与延迟/成本之间进行权衡。模型将thinking_level视为内部多步推理的相对配额,而非严格的 token 保证。Pro 的默认通常为high。这是供开发者调节多步规划与链式推理深度的新显式控制。 - 结构化输出与工具: 模型支持结构化 JSON 输出,并可与内置工具结合(Google Search 基于来源的对齐、URL 上下文、代码执行等)。部分结构化输出+工具能力仅在
gemini-3-pro-preview中提供预览。 - 多模态与智能体集成: Gemini 3 Pro 明确面向智能体工作流(工具 + 多个智能体跨代码/终端/浏览器)。
限制与已知注意事项
- 事实性并非完美——仍可能出现幻觉。 尽管 Google 声称事实性显著提升,但在高风险场景(法律、医疗、金融)中仍需基于来源的校验与人工复核。
- 长上下文表现随任务而异。 支持 1M 输入窗口是硬能力,但在极端长度下,某些基准上的实证效果会下降(在 1M 长度的一些长上下文测试中观察到单点性能下降)。
- 成本与延迟权衡。 大上下文与更高的
thinking_level设置会增加计算、延迟与成本;定价会基于 token 量分级。可使用thinking_level与分块策略来管理成本。 - 安全与内容过滤。 Google 仍在应用安全政策与审查层;某些内容与操作仍受限或会触发拒绝模式。
Gemini 3 Pro Preview 与其他顶级模型的比较
高层对比(预览版 → 定性):
对比 Gemini 2.5 Pro: 在推理、智能体工具使用与多模态集成方面实现跨越式提升;更大的上下文处理与更好的长文本理解。在学术推理、编码与多模态任务上,DeepMind 显示出稳定增益。
对比 GPT-5.1 和 Claude Sonnet 4.5(据报道): 在 Google/DeepMind 的基准组合上,Gemini 3 Pro 被呈现为在多个智能体、多模态与长上下文指标上领先(见 Terminal-Bench、MMMU-Pro、AIME)。具体对比因任务而异。
典型与高价值用例
- 大型文档/书籍总结与问答: 长上下文支持使其对法律、研究与合规团队具有吸引力。
- 仓库级代码理解与生成: 与编码工具链集成与改进的推理有助于大型代码库重构与自动化代码审查工作流。
- 多模态产品助手: 图像 + 文本 + 音频工作流(可接收截图、通话片段与文档的客服场景)。
- 媒体生成与编辑(照片 → 视频): 早期 Gemini 系列特性现已包含 Veo/Flow 风格的照片→视频能力;预览显示更深入的多媒体生成,适用于原型与媒体工作流。
如何访问 Gemini 3 Pro API
步骤 1:申请 API Key
登录 cometapi.com。若您尚未成为我们的用户,请先注册。登录您的 CometAPI 控制台。获取接口的访问凭据 API key。在个人中心的 API token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。
步骤 2:向 Gemini 3 Pro API 发送请求
选择 “gemini-3-pro” 端点以发送 API 请求并设置请求体。请求方法与请求体可在我们的网站 API 文档中获取。我们的网站还提供 Apifox 测试以供便捷使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。基础 URL 为 Gemini 生成内容 与 聊天
在 content 字段中插入您的问题或请求——模型将对此进行响应。处理 API 响应以获取生成的答案。
步骤 3:检索并验证结果
处理 API 响应以获取生成的答案。处理完成后,API 将返回任务状态与输出数据。