Google เปิดตัวโมเดลการฝังข้อความระดับการผลิตรุ่นแรกอย่างเป็นทางการ เจมินี่-ฝัง-001ซึ่งถือเป็นช่วงเวลาสำคัญในความพยายามของบริษัทในการพัฒนาความเข้าใจและการนำเสนอภาษาธรรมชาติ ปัจจุบันโมเดลที่ล้ำสมัยนี้เปิดให้นักพัฒนาใช้งานได้อย่างกว้างขวางผ่าน Gemini API, Google AI Studio และ Vertex AI สัญญาว่าจะนิยามการค้นหาเชิงความหมาย ระบบแนะนำ และแอปพลิเคชัน AI ปลายน้ำที่หลากหลายขึ้นใหม่
คุณสมบัติหลักและความสามารถ
- การสนับสนุนหลายภาษา: gemini-embedding-001 จัดการภาษาต่างๆ มากกว่า 100 ภาษาโดยตรง ช่วยให้สามารถปรับใช้ทั่วโลกและค้นหางานข้ามภาษาได้อย่างแท้จริง
- ความยาวของบริบท: โมเดลนี้ยอมรับอินพุตสูงสุด 2,048 โทเค็น รองรับเอกสารรูปแบบยาว สนิปเป็ตโค้ด และข้อความหลายประโยคโดยไม่ตัดทอน
- มิติเอาต์พุตแบบไดนามิก: ด้วยการใช้ประโยชน์จากเทคนิค Matryoshka Representation Learning (MRL) ที่เป็นกรรมสิทธิ์ของ Google นักพัฒนาสามารถปรับขนาดการฝังได้อย่างยืดหยุ่น—ขนาดเริ่มต้นคือ 3072 และสามารถลดขนาดลงเหลือ 1536 หรือ 768 ได้ตามต้องการ—ทำให้เหมาะสมกับต้นทุนการจัดเก็บและการคำนวณในขณะที่ยังคงรักษาความเที่ยงตรงสูงไว้ได้
ประสิทธิภาพมาตรฐาน
gemini-embedding-001 ได้แสดงผลลัพธ์ระดับสูงสุดแล้ว **เกณฑ์มาตรฐานการฝังข้อความจำนวนมาก (MTEB)**ในการประเมินแบบหลายภาษาและภาษาเดียว พบว่าได้คะแนนงานเฉลี่ยเท่ากับ 68.32เหนือกว่าคู่แข่งชั้นนำอย่างระบบฝังตัวแบบ Mistral และ Qwen อย่างเห็นได้ชัด โดยได้คะแนน 85.13 ในงานจำแนกคู่ 67.71 ในงานดึงข้อมูล และ 65.58 ในการจัดอันดับใหม่ ซึ่งเป็นตัวชี้วัดที่เน้นย้ำถึงความคล่องตัวในการใช้งานในสถานการณ์การประมวลผลข้อความที่หลากหลาย

วิธีใช้
เพื่อส่งเสริมการทดลองและการนำไปใช้ Google จึงจัดให้มีทั้ง ระดับฟรีและจ่ายเงิน สำหรับ gemini-embedding-001 หลังจากใช้โควตาฟรีเทียร์หมดแล้ว การใช้งานจะถูกเรียกเก็บเงินที่ $0.15 ต่อหนึ่งล้านโทเค็นอินพุตทำให้มีราคาที่สามารถแข่งขันได้ภายในอุตสาหกรรม ขีดจำกัดอัตราได้รับการออกแบบมาเพื่อรองรับกรณีการใช้งานที่หลากหลาย ตั้งแต่ต้นแบบการพัฒนาแบบน้ำหนักเบาไปจนถึงการปรับใช้ในระดับองค์กร
นักพัฒนาสามารถเข้าถึงได้ gemini-embedding-001 วันนี้ผ่านทางที่มีอยู่ embed_content จุดสิ้นสุดใน Gemini API การผสานรวมกับ Google AI Studio และ Vertex AI ช่วยให้ประสบการณ์การใช้งานราบรื่น ตัวอย่างการใช้งานใน Python นั้นตรงไปตรงมา:
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
สำหรับผู้ที่กำลังเปลี่ยนจากการทดลอง gemini-embedding-exp-03-07 หรือโมเดลการฝังแบบเดิม (embedding-001, text-embedding-004) Google ได้ประกาศกำหนดเวลาการเลิกใช้: เวอร์ชันทดลองและเวอร์ชันเดิม embedding-001 จะเกษียณอายุในวันที่ สิงหาคม 14, 2025ในขณะที่ text-embedding-004 มีกำหนดจะเลิกใช้ January 14, 2026ขอแนะนำให้ทำการโยกย้ายไปยัง gemini-embedding-001 ก่อนกำหนด เพื่อให้แน่ใจว่าบริการจะดำเนินต่อไปอย่างต่อเนื่องและสามารถเข้าถึงการปรับปรุงประสิทธิภาพล่าสุดได้
มองไปข้างหน้า Google วางแผนที่จะขยายความสามารถของ Gemini Embedding ด้วย API แบตช์ รองรับการประมวลผลแบบอะซิงโครนัสที่คุ้มค่า รวมถึงโมเดลการฝังตัวในอนาคตที่ครอบคลุมรูปแบบการใช้งานที่หลากหลายยิ่งขึ้น ด้วยความสามารถในการรองรับหลายภาษาที่ทรงพลัง มิติข้อมูลที่ปรับได้ และราคาที่แข่งขันได้ gemini-embedding-001 จึงพร้อมที่จะขับเคลื่อนแอปพลิเคชันที่ขับเคลื่อนด้วย AI รุ่นต่อไป
เริ่มต้นใช้งาน
CometAPI มอบอินเทอร์เฟซ REST แบบรวมที่รวบรวมโมเดล AI หลายร้อยโมเดลภายใต้จุดสิ้นสุดที่สอดคล้องกัน พร้อมด้วยการจัดการคีย์ API ในตัว โควตาการใช้งาน และแดชบอร์ดการเรียกเก็บเงิน แทนที่จะต้องจัดการ URL และข้อมูลรับรองของผู้ขายหลายราย
นักพัฒนาสามารถเข้าถึงได้ Gemini 2.5 Pro พรีวิว และ วีโอ 3 ตลอด โคเมทเอพีไอรุ่นล่าสุดที่ระบุไว้เป็นข้อมูล ณ วันที่เผยแพร่บทความ และเพิ่มประสิทธิภาพให้กับเทอร์มินัลของคุณด้วย Gemini CLI ของ Google บน CometAPI! เริ่มต้นด้วยการสำรวจความสามารถของโมเดลใน สนามเด็กเล่น และปรึกษา คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนเข้าใช้งาน โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับรหัส API แล้ว โคเมทเอพีไอ เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ
การผสานรวมล่าสุด gemini-embedding-001 จะปรากฏบน CometAPI เร็วๆ นี้ โปรดติดตาม! ในขณะที่เรากำลังสรุปการอัปโหลดโมเดล gemini-embedding-001 ให้สำรวจโมเดลอื่นๆ ของเราในหน้าโมเดลหรือลองใช้ใน AI Playground
