Google 发布 gemini-embedding-001:其首个文本嵌入模型

CometAPI
AnnaJul 16, 2025
Google 发布 gemini-embedding-001:其首个文本嵌入模型

Google 正式发布其首个生产级文本嵌入模型 gemini-embedding-001,这标志着该公司在推进自然语言理解与表示方面的努力迎来关键时刻。通过 Gemini API、Google AI Studio 和 Vertex AI,该最先进的模型现已面向开发者广泛提供,有望重新定义语义搜索、推荐系统以及各类下游 AI 应用。

主要特性与能力

  • **多语言支持:**gemini-embedding-001 原生支持 100 多种语言,实现真正的全球化部署与跨语言检索任务。
  • **上下文长度:**模型可接受最长 2,048 个 token 的输入,能够在不截断的情况下处理长文档、代码片段和多句段落。
  • **动态输出维度:**借助 Google 的专有 Matryoshka Representation Learning (MRL) 技术,开发者可以灵活调整嵌入向量维度——默认 3072 维,可选缩减至 1536 或 768——在保持高保真度的同时优化存储与计算成本。

基准表现

gemini-embedding-001 已在 Massive Text Embedding Benchmark (MTEB) 上展现出一流成绩。在多语种与单语评测中,其平均任务得分达 68.32,超越了包括 Mistral 与基于 Qwen 的嵌入在内的领先竞品。值得注意的是,其在成对分类任务上的得分为 85.13,检索为 67.71,重排序为 65.58,彰显了其在多样文本处理场景中的通用性。

Google 发布 gemini-embedding-001

使用方法

为鼓励试验与采用,Google 为 gemini-embedding-001 提供免费与付费两个层级。用完免费额度后,按每一百万个输入 token 收费 $0.15,在业内具有竞争力。速率限制经过设计,可满足从轻量级开发原型到企业级部署的多种用例。

开发者今天即可通过 Gemini API 中现有的 embed_content 端点访问 gemini-embedding-001。与 Google AI Studio 和 Vertex AI 的集成可确保顺畅的上手体验。以下是 Python 的简要用法示例:

from google import genai

client = genai.Client()

result = client.models.embed_content(
    model="gemini-embedding-001",
    contents="生命的意义是什么?"
)
print(result.embeddings)

对于从实验版 gemini-embedding-exp-03-07 或传统嵌入模型(embedding-001text-embedding-004)迁移的用户,Google 已公布停用时间表:实验版与传统的 embedding-001 将于 2025 年 8 月 14 日 退役,而 text-embedding-004 计划于 2026 年 1 月 14 日 弃用。建议尽早迁移至 gemini-embedding-001,以确保服务不中断并获取最新性能改进。

展望未来,Google 计划通过支持 Batch API 来扩展 Gemini Embedding 的能力,以实现异步、具成本效益的处理,并将推出覆盖更广模态的后续嵌入模型。凭借强大的多语言覆盖、可调维度以及具有竞争力的定价,gemini-embedding-001 将为新一代 AI 驱动应用提供动力。

入门

CometAPI 提供统一的 REST 接口,将数百个 AI 模型聚合在同一端点下,并内置 API Key 管理、用量配额与计费仪表盘。无需再同时管理多个供应商的 URL 与凭据。

开发者可通过 CometAPI 访问 Gemini 2.5 Pro PreviewVeo 3,所列模型版本以本文发布日期为准。并且可在 CometAPI 上使用 Google 的 Gemini CLI 强化你的终端体验!开始之前,可先在 Playground 探索模型能力,并查阅 API guide 获取详细说明。访问前请确保已登录 CometAPI 并获取 API Key。CometAPI 提供远低于官方价格的方案,助你更轻松地集成。

最新集成的 gemini-embedding-001 将很快出现在 CometAPI 上,敬请期待!在我们最终完成 gemini-embedding-001 模型上传期间,欢迎先在 Models 页面探索其他模型,或在 AI Playground 中试用。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣