واجهة برمجة التطبيقات Phi-4-mini

CometAPI
AnnaMar 9, 2025
واجهة برمجة التطبيقات Phi-4-mini

تمثل واجهة برمجة التطبيقات Phi-4-Mini مایکروسوفتأحدث ابتكارات شركة 'S في نماذج اللغة الصغيرة ضمن سلسلة Phi-4، مع التركيز بشكل أساسي على مهام نصيةبفضل إطاره المدمج الذي يحتوي على 3.8 مليار معلمة، يتميز Phi-4-Mini بالسرعة والكفاءة بفضل بنية المحول الكثيفة المخصصة لفك التشفير فقط.

واجهة برمجة التطبيقات Phi-4-mini

الخصائص الرئيسية لـ Phi-4-Mini

(أراضي البوديساتفا) نموذج فاي-4-ميني تتميز بقدرتها على أداء مجموعة متنوعة من المهام مثل الاستدلال النصي, عمليات حسابية, البرمجة، واستدعاءات الوظائف. على الرغم من صغر حجمه نسبيًا، ينافس Phi-4-Mini نماذج اللغات الأكبر حجمًا، بل ويتفوق عليها غالبًا، في هذه المجالات:

  • الاستدلال النصي:إنه يتفوق في المهام التي تتطلب معالجة منطقية، ويقدم أداءً مشابهًا للنماذج ذات المعلمات الأكبر بكثير.
  • دعم شامل للنصوص الطويلة:تتمتع Phi-128-Mini بالقدرة على معالجة تسلسلات تصل إلى 4 ألف رمز، وهي مثالية للتعامل مع النصوص المكثفة بكفاءة.
  • تكامل الوظائف القابلة للتطوير:تتيح قدرات استدعاء الوظيفة الخاصة بـ Phi-4-Mini التكامل السلس مع الأدوات الخارجية وواجهات برمجة التطبيقات ومصادر البيانات، مما يعزز تنوعها في سيناريوهات التطبيق.

المبادئ التقنية وراء Phi-4-Mini

يعتمد تصميم Phi-4-Mini على تصميم تقني متطور يهدف إلى تعظيم الكفاءة والقدرة على التكيف:

  • هندسة المحولات:تم بناء النموذج على إطار عمل Transformer المخصص لفك التشفير فقط، باستخدام آليات الاهتمام الذاتي لإدارة التبعيات طويلة المدى داخل تسلسلات النصوص بشكل فعال.
  • تنبيه الاستعلام المجمع:تعمل هذه الآلية على تحسين الكفاءة الحسابية من خلال معالجة الاستعلامات في دفعات مجمعة، مما يعزز قدرة النموذج على المعالجة المتوازية.
  • استراتيجية التضمين المشتركة:من خلال مشاركة تضمينات الإدخال والإخراج، يقلل Phi-4-Mini من حمل المعلمات، مما يعزز القدرة على التكيف مع المهام والكفاءة التشغيلية.

هذه الاختيارات المعمارية تجعل Phi-4-Mini متميزًا في جيل اللغة الطبيعية مع الحفاظ على الأداء العالي عبر حالات الاستخدام المتنوعة.

تفاصيل البيانات والتدريب

بيانات تدريب اللغة

تتضمن بيانات تدريب Phi-4-Mini بيانات نصية عالية الجودة وغنية بالاستدلال، وخاصةً مجموعات بيانات برمجية مُختارة بعناية لتحسين أداء مهام البرمجة. وقد تم تحسين بيانات ما قبل التدريب باستخدام المرشحات واستراتيجيات خلط البيانات لضمان جودة عالية وتنوع البيانات. وتحديدًا، تتضمن بيانات ما قبل التدريب مجموعة بيانات مكونة من 5 تريليونات رمز، وهي أكبر وأعلى جودة من Phi-3.5-Mini.

بيانات تدريب الرؤية واللغة

تتضمن مرحلة ما قبل التدريب في Phi-4-Multimodal مجموعات بيانات غنية من الصور والنصوص، بما في ذلك مستندات الصور والنصوص المتداخلة، وأزواج الصور والنصوص، وبيانات تحديد موقع الصور، وغيرها. تتضمن عملية ما قبل التدريب 0.5 تريليون رمز، تجمع بين العناصر البصرية والنصية. تستخدم مرحلة الضبط الدقيق المُشرف (SFT) مجموعة بيانات عامة متعددة الوسائط مُعدّلة التعليمات، ومجموعة بيانات داخلية واسعة النطاق مُعدّلة التعليمات، تغطي مهامًا مثل فهم الصور الطبيعية، وتفسير المخططات والجداول والرسوم البيانية، وتحليل PowerPoint، والتعرف الضوئي على الحروف (OCR)، ومقارنة الصور المتعددة، وتلخيص الفيديو، وأمن النموذج.

بيانات تدريب الكلام البصري

تم تدريب Phi-4-Multimodal على بيانات الكلام المرئي، شاملةً سيناريوهات الإطار الواحد والإطارات المتعددة. وضمنت جودة البيانات العالية تحويل استعلامات المستخدم من نص إلى صوت عبر محرك تحويل النص إلى كلام داخلي (TTS). وبشكل أكثر تحديدًا، استخدم الباحثون نموذج التعرف التلقائي على الكلام (ASR) الداخلي لنسخ الصوت وحساب معدل خطأ الكلمات (WER) بين النص الأصلي والنسخة المنسوخة، وضمنت جودة بيانات الكلام المرئي النهائية من خلال تصفية معدل خطأ الكلمات (WER).

بيانات تدريب الكلام والصوت

تتضمن بيانات تدريب ميزات الكلام/الصوت بيانات نسخ التعرف التلقائي على الكلام (ASR) وبيانات ما بعد التدريب، والتي تغطي مجموعة متنوعة من المهام مثل الترجمة التلقائية للكلام (AST)، والإجابة على أسئلة الكلام (SQA)، وتلخيص الكلام (SSUM)، وفهم الصوت (AU). تتضمن بيانات ما قبل التدريب حوالي مليوني ساعة من أزواج الكلام والنص الداخلية مجهولة المصدر، تغطي 2 لغات مدعومة. تتضمن بيانات ما بعد التدريب حوالي 8 مليون عينة صوتية وكلامية مختارة بعناية من SFT، تغطي مهام مثل ASR، وAST، وSQA، وSQQA، وSSUM، وAU.

مواضيع ذات صلة:أفضل 3 نماذج لتوليد الموسيقى بالذكاء الاصطناعي لعام 2025

النشر الأمثل والتوافق

تم تحسين Phi-4-Mini لـ التوافق عبر الأنظمة الأساسية، مما يسهل النشر في بيئات الحوسبة المختلفة:

  • تحسين وقت تشغيل ONNX:يضمن أداء النموذج بكفاءة في الإعدادات منخفضة التكلفة ومنخفضة زمن الوصول، ويدعم التطبيقات واسعة النطاق عبر الأنظمة الأساسية.
  • البيئات المحدودة الموارد:تجعل طبيعتها خفيفة الوزن Phi-4-Mini مناسبة لنشر الحوسبة الحافة حيث تكون الموارد محدودة، مما يزيد من الكفاءة التشغيلية دون المساس بالقدرات.

فلسفة التدريب واستخدام البيانات

إن عملية تدريب Phi-4-Mini صارمة، حيث تركز على مجموعات البيانات المتنوعة عالية الجودة لتعزيزها منطق و معالجة المنطق قدرات:

  • بيانات التدريب المُفحصة:يدمج مجموعات البيانات الاصطناعية والمستهدفة لتحسين أداء المهام الرياضية والبرمجية.
  • التكيف والدقة:تركز استراتيجية التدريب على جودة البيانات وتنوعها، وإعداد النموذج لمهام التفكير المعقدة عبر تطبيقات متنوعة.

حالات الاستخدام في العالم الحقيقي

يقدم Phi-4-Mini تطبيقات واسعة في العديد من السيناريوهات، مما يظهر قدرته على التكيف وفائدته:

  • أنظمة الإجابة الذكية:يؤدي أداءً استثنائيًا في مهام الأسئلة والأجوبة المعقدة، ويوفر إجابات دقيقة وسريعة مناسبة لتطبيقات خدمة العملاء.
  • مساعدة البرمجة:يوفر للمطورين أدوات قوية لإنشاء التعليمات البرمجية واختبارها، مما يعزز الإنتاجية وكفاءة سير العمل.
  • قدرات متعددة اللغات:يدعم الترجمة والمعالجة عبر لغات متعددة، مما يجعله مثاليًا لخدمات اللغة العالمية والتطبيقات عبر الثقافات.
  • الحوسبة الحافة والنشر:تم تحسين Phi-4-Mini لنشر الأجهزة المحمولة، وهو يعمل بشكل جيد في سيناريوهات الحوسبة الحافة حيث تكون المعالجة الفعالة أمرًا بالغ الأهمية.

الخلاصة:

يُمثل Phi-4-Mini، بتصميمه المبتكر وأدائه الاستثنائي في معالجة النصوص، تقدمًا ملحوظًا في تكنولوجيا نماذج اللغات الصغيرة. يوفر هذا النموذج للمطورين ومستخدمي الذكاء الاصطناعي أداة عالية الكفاءة قادرة على إدارة تطبيقات واسعة ومتنوعة دون الحاجة إلى موارد حاسوبية ضخمة. ومع تطور سلسلة Phi-4 من مايكروسوفت، تضمن قدرة Phi-4-Mini على التكيف والتكامل استمرار أهميتها وفائدتها في بيئات الذكاء الاصطناعي المتطورة، مما يُمثل في نهاية المطاف موردًا أساسيًا للتطورات المستقبلية في مجال الذكاء الاصطناعي.

كيفية استدعاء واجهة برمجة التطبيقات Phi-4-Mini هذه من CometAPI

1.تسجيل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يُرجى التسجيل أولاً.

2.احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز واجهة برمجة التطبيقات في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.

  1. احصل على عنوان URL لهذا الموقع: https://api.cometapi.com/

٤. حدد نقطة نهاية Phi-4-Mini لإرسال طلب واجهة برمجة التطبيقات (API) وحدد نص الطلب. يتم الحصول على طريقة الطلب ونصه من وثيقة API لموقعنا على الويبيوفر موقعنا أيضًا اختبار Apifox لراحتك.

  1. عالج استجابة واجهة برمجة التطبيقات (API) للحصول على الإجابة المُولَّدة. بعد إرسال طلب واجهة برمجة التطبيقات، ستتلقى كائن JSON يحتوي على الإكمال المُولَّد.
اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%