Google ra mắt gemini-embedding-001: mô hình nhúng văn bản đầu tiên của Google

CometAPI
AnnaJul 16, 2025
Google ra mắt gemini-embedding-001: mô hình nhúng văn bản đầu tiên của Google

Google chính thức công bố mô hình nhúng văn bản cấp độ sản xuất đầu tiên của mình, gemini-embedding-001, đánh dấu một thời điểm then chốt trong nỗ lực của công ty nhằm nâng cao khả năng hiểu và biểu diễn ngôn ngữ tự nhiên. Hiện đã được cung cấp rộng rãi cho các nhà phát triển thông qua Gemini API, Google AI Studio và Vertex AI, mô hình tiên tiến này hứa hẹn sẽ định nghĩa lại tìm kiếm ngữ nghĩa, hệ thống đề xuất và một loạt các ứng dụng AI hạ nguồn.

Các tính năng và khả năng chính

  • Hỗ trợ đa ngôn ngữ: gemini-embedding-001 có thể xử lý hơn 100 ngôn ngữ, cho phép triển khai toàn cầu thực sự và thực hiện các tác vụ truy xuất đa ngôn ngữ.
  • Độ dài ngữ cảnh: Mô hình này chấp nhận đầu vào lên đến 2,048 mã thông báo, hỗ trợ các tài liệu dài, đoạn mã và đoạn văn nhiều câu mà không bị cắt bớt.
  • Kích thước đầu ra động: Tận dụng kỹ thuật Matryoshka Representation Learning (MRL) độc quyền của Google, các nhà phát triển có thể linh hoạt điều chỉnh kích thước nhúng—3072 chiều theo mặc định, với tùy chọn giảm xuống còn 1536 hoặc 768—tối ưu hóa chi phí lưu trữ và tính toán trong khi vẫn duy trì độ trung thực cao.

Hiệu suất chuẩn

gemini-embedding-001 đã chứng minh được kết quả hàng đầu trên Tiêu chuẩn nhúng văn bản hàng loạt (MTEB). Trong các đánh giá đa ngôn ngữ và đơn ngôn ngữ, nó đạt được điểm nhiệm vụ trung bình là 68.32, vượt qua các đối thủ hàng đầu như Mistral và các công nghệ nhúng dựa trên Qwen. Đáng chú ý, nó đạt 85.13 điểm trong các bài toán phân loại cặp, 67.71 điểm trong bài toán truy xuất và 65.58 điểm trong bài toán xếp hạng lại - những chỉ số nhấn mạnh tính linh hoạt của nó trong nhiều tình huống xử lý văn bản khác nhau.

Google ra mắt gemini-embedding-001

Cách Sử dụng

Để khuyến khích thử nghiệm và áp dụng, Google cung cấp cả các bậc miễn phí và trả phí cho gemini-embedding-001. Sau khi sử dụng hết hạn ngạch miễn phí, mức sử dụng sẽ được tính phí $0.15 cho một triệu mã thông báo đầu vào, giúp sản phẩm có giá cả cạnh tranh trong ngành. Giới hạn giá được thiết kế để phù hợp với nhiều trường hợp sử dụng, từ nguyên mẫu phát triển nhẹ đến triển khai quy mô doanh nghiệp.

Các nhà phát triển có thể truy cập gemini-embedding-001 ngày nay thông qua hiện tại embed_content Điểm cuối trong API Gemini. Tích hợp với Google AI Studio và Vertex AI đảm bảo trải nghiệm tích hợp mượt mà. Ví dụ sử dụng trong Python rất đơn giản:

from google import genai

client = genai.Client()

result = client.models.embed_content(
    model="gemini-embedding-001",
    contents="What is the meaning of life?"
)
print(result.embeddings)

Đối với những người đang chuyển đổi từ thử nghiệm gemini-embedding-exp-03-07 hoặc các mô hình nhúng cũ (embedding-001, text-embedding-004), Google đã công bố mốc thời gian ngừng hỗ trợ: phiên bản thử nghiệm và phiên bản cũ embedding-001 sẽ được nghỉ hưu vào Tháng Tám 14, 2025, trong khi text-embedding-004 được lên kế hoạch ngừng sử dụng vào ngày 14 Tháng một, 2026. Nên di chuyển sớm sang gemini-embedding-001 để đảm bảo dịch vụ không bị gián đoạn và có quyền truy cập vào những cải tiến hiệu suất mới nhất.

Nhìn về phía trước, Google có kế hoạch mở rộng khả năng của Gemini Embedding với API hàng loạt hỗ trợ xử lý không đồng bộ, tiết kiệm chi phí, cũng như các mô hình nhúng trong tương lai bao phủ nhiều phương thức hơn. Với phạm vi phủ sóng đa ngôn ngữ mạnh mẽ, khả năng tùy chỉnh đa chiều và giá cả cạnh tranh, gemini-embedding-001 sẵn sàng hỗ trợ thế hệ ứng dụng AI tiếp theo.

Bắt đầu

CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.

Các nhà phát triển có thể truy cập Xem trước Gemini 2.5 ProPhiên bản 3 thông qua Sao chổiAPI, các phiên bản mẫu mới nhất được liệt kê là tính đến ngày xuất bản bài viết. Và nạp năng lượng cho thiết bị đầu cuối của bạn với CLI Gemini của Google trên CometAPI! Để bắt đầu, hãy khám phá các khả năng của mô hình trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Tích hợp mới nhất gemini-embedding-001 sẽ sớm xuất hiện trên CometAPI, vì vậy hãy chú ý theo dõi! Trong khi chúng tôi hoàn thiện việc tải lên Mô hình gemini-embedding-001, hãy khám phá các mô hình khác của chúng tôi trên trang Mô hình hoặc dùng thử chúng trong AI Playground.

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%