كشفت شركة جوجل رسميًا عن أول نموذج لتضمين النصوص على مستوى الإنتاج، تضمين الجوزاء-001، مما يُمثل نقطة تحول في جهود الشركة لتطوير فهم اللغة الطبيعية وتمثيلها. أصبح هذا النموذج المتطور متاحًا الآن على نطاق واسع للمطورين عبر واجهة برمجة تطبيقات جيميني، وجوجل إيه آي ستوديو، وفيرتكس إيه آي، ويَعِد بإعادة تعريف البحث الدلالي، وأنظمة التوصية، ومجموعة واسعة من تطبيقات الذكاء الاصطناعي اللاحقة.
الميزات والقدرات الرئيسية
- دعم متعدد اللغات: يتعامل gemini-embedding-001 بشكل أصلي مع أكثر من 100 لغة، مما يتيح نشرًا عالميًا حقيقيًا ومهام استرجاع متعددة اللغات.
- طول السياق: يقبل النموذج مدخلات تصل إلى 2,048 رمزًا، ويستوعب المستندات الطويلة، ومقاطع التعليمات البرمجية، والمقاطع المكونة من عدة جمل دون اقتطاع.
- أبعاد الإخراج الديناميكية: من خلال الاستفادة من تقنية Matryoshka Representation Learning (MRL) المملوكة لشركة Google، يمكن للمطورين تعديل حجم التضمين بمرونة - 3072 بُعدًا بشكل افتراضي، مع تخفيضات اختيارية إلى 1536 أو 768 - مما يؤدي إلى تحسين تكاليف التخزين والحوسبة مع الحفاظ على الدقة العالية.
الأداء المعياري
لقد أظهر gemini-embedding-001 بالفعل نتائج من الدرجة الأولى على معيار تضمين النصوص الضخمة (MTEB). وفي التقييمات متعددة اللغات وأحادية اللغة، حققت درجة مهمة متوسطة قدرها 68.32متجاوزًا بذلك منافسين رائدين مثل Mistral وتقنيات التضمين القائمة على Qwen. والجدير بالذكر أنه حقق 85.13 نقطة في مهام تصنيف الأزواج، و67.71 نقطة في الاسترجاع، و65.58 نقطة في إعادة الترتيب، وهي مقاييس تؤكد تنوعه في سيناريوهات معالجة النصوص المتنوعة.

كيف تعمل
لتشجيع التجريب والتبني، توفر Google كلاً من المستويات المجانية والمدفوعة لـ gemini-embedding-001. بعد استنفاد حصص الطبقة المجانية، تُفرض رسوم الاستخدام على \0.15 دولارًا لكل مليون رمز إدخال، مما يجعلها ذات سعر تنافسي داخل الصناعة. تم تصميم حدود الأسعار لاستيعاب مجموعة من حالات الاستخدام، من نماذج التطوير خفيفة الوزن إلى عمليات النشر على نطاق المؤسسة.
يمكن للمطورين الوصول gemini-embedding-001 اليوم من خلال القائمة embed_content نقطة نهاية في واجهة برمجة تطبيقات Gemini. يضمن التكامل مع Google AI Studio وVertex AI تجربة إعداد سلسة. مثال على الاستخدام في Python سهل:
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
بالنسبة لأولئك الذين ينتقلون من المرحلة التجريبية gemini-embedding-exp-03-07 أو نماذج التضمين القديمة (embedding-001, text-embedding-004), أعلنت Google عن جداول زمنية للتوقف عن العمل: الإصدار التجريبي والإصدار القديم embedding-001 سيتم تقاعده في 14 أغسطس 2025، في حين text-embedding-004 من المقرر إلغاؤه في 14 كانون الثاني 2026يُنصح بالهجرة المبكرة إلى gemini-embedding-001 لضمان استمرار الخدمة والوصول إلى أحدث تحسينات الأداء.
بالنظر إلى المستقبل، تخطط Google لتوسيع قدرات Gemini Embedding مع دفعة API دعم المعالجة غير المتزامنة والفعّالة من حيث التكلفة، بالإضافة إلى نماذج تضمين مستقبلية تغطي نطاقات أوسع. بفضل تغطيته القوية متعددة اللغات، وأبعاده القابلة للتعديل، وأسعاره التنافسية، يُعدّ gemini-embedding-001 جاهزًا لدعم الجيل القادم من التطبيقات المعتمدة على الذكاء الاصطناعي.
كيف تبدأ
يوفر CometAPI واجهة REST موحدة تجمع مئات نماذج الذكاء الاصطناعي ضمن نقطة نهاية موحدة، مع إدارة مدمجة لمفاتيح واجهة برمجة التطبيقات، وحصص الاستخدام، ولوحات معلومات الفواتير. بدلاً من إدارة عناوين URL وبيانات اعتماد متعددة للموردين.
يمكن للمطورين الوصول معاينة Gemini 2.5 Pro و فيو 3 من خلال كوميت ايه بي ايأحدث إصدارات الطرازات المدرجة هي اعتبارًا من تاريخ نشر المقال. وعزز جهازك بـ واجهة سطر أوامر Gemini من Google على CometAPI! للبدء، استكشف إمكانيات النموذج في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل.
سيظهر أحدث تكامل gemini-embedding-001 قريبًا على CometAPI، لذا ترقبوا ذلك! بينما ننهي تحميل نموذج gemini-embedding-001، استكشف نماذجنا الأخرى على صفحة النماذج أو جربها في AI Playground.
