الوكلاء يُحدثون تحولاً في تطوير الذكاء الاصطناعي: أحدث تحديثات OpenAI

CometAPI
AnnaJun 3, 2025
الوكلاء يُحدثون تحولاً في تطوير الذكاء الاصطناعي: أحدث تحديثات OpenAI

4 يونيو، 2025 أصدرت OpenAI مجموعةً فعّالة من التحديثات تهدف إلى إحداث ثورة في كيفية بناء المطورين لوكلاء الذكاء الاصطناعي، وخاصةً تلك التي تتمتع بقدرات تفاعلية صوتية. تشمل التحديثات جوانب متعددة: دعم كامل للغة TypeScript في حزمة تطوير برامج الوكلاء، وآلية تدخل بشري، وإطلاق RealtimeAgent لتطبيقات الصوت اللحظية، وتحسينات جوهرية على نموذج تحويل الكلام إلى كلام من OpenAI.

تعمل هذه التحديثات مجتمعة على جعل بناء وكلاء الذكاء الاصطناعي الآمنين والقابلين للتحكم والجذابين أكثر سهولة من أي وقت مضى.


TypeScript يصل إلى مجموعة أدوات تطوير البرامج (SDK) للوكلاء

تمكين المطورين في نظام الويب البيئي

تدعم مجموعة تطوير البرامج (SDK) الشهيرة لوكلاء OpenAI الآن لغة TypeScript، مما يوفر أدوات قوية للمطورين الذين يبنون تطبيقات الذكاء الاصطناعي في بيئات JavaScript وNode.js. يوفر إصدار TypeScript تكافؤًا في الميزات مع نظيره في Python، ويدعم جميع العناصر الأساسية لبناء الوكلاء:

  • عمليات التسليم - نقل المهام بسلاسة عبر وكلاء متعددين
  • أسوار - القيود السلوكية وآليات السلامة
  • البحث عن المفقودين - التسجيل الدقيق والتشخيصات
  • MCP (نمط متعدد المكونات) - دعم الوكلاء المعياريين والموزعين

لماذا يهم:

يمكن لمطوري الويب الآن تضمين وكلاء الذكاء الاصطناعي بسلاسة في المتصفحات وتطبيقات الويب وبيئات Node.js، مما يتيح تجارب مثل المساعدين الصوتيين ودردشة الروبوتات في الوقت الفعلي والمساعدين داخل المتصفح.


آلية المراجعة البشرية (HITL)

تقديم الرقابة البشرية لضمان سلوك أكثر أمانًا للوكلاء

لتعزيز السلامة والمساءلة، تُقدّم OpenAI ميزة الموافقة البشرية ضمن سير عمل الوكيل. قبل أن يتمكن الوكيل من تنفيذ بعض استدعاءات الأدوات الخارجية أو إجراءات واجهة برمجة التطبيقات (API)، يُمكن للموظف التدخل للموافقة على السلوك أو رفضه أو تعديله.

سير العمل الأساسي:

  1. إيقاف تنفيذ الأداة مؤقتًا
  2. تسلسل وحفظ حالة الوكيل الحالية
  3. طلب المراجعة البشرية والموافقة
  4. استئناف سير العمل بعد التأكيد

مثالي لاجل:

حالات استخدام تنطوي على مخاطر عالية، مثل المعاملات المالية، وتحليل البيانات الطبية، أو مهام خدمة العملاء الحساسة. تُعزز هذه الآلية الشفافية والامتثال والضمانات الأخلاقية في عملية اتخاذ القرارات المتعلقة بالذكاء الاصطناعي.


RealtimeAgent: بناء وكلاء الصوت لم يكن أسهل من أي وقت مضى

OpenAI الجديد وكيل الوقت الحقيقي تستفيد هذه القدرة من واجهة برمجة التطبيقات في الوقت الفعلي للسماح للمطورين ببناء وكلاء صوتيين أقوياء يعملون إما على جانب العميل أو جانب الخادم.

الميزات الرئيسية:

  • إدخال وإخراج الكلام في الوقت الفعلي
  • استدعاء الوظيفة/الأداة المتكاملة
  • دعم المقاطعات وتشغيل الصوت الديناميكي
  • التوافق مع عمليات التسليم والحواجز الواقية

لماذا هو تحويلي:
الآن، يُمكن تطوير وكلاء الصوت تمامًا مثل وكلاء النصوص، مع إمكانية الوصول الكامل إلى أدوات الذكاء الاصطناعي ومنطقه. هذا يفتح الباب لتطبيقات متقدمة مثل:

  • أنظمة دعم الصوت المدعومة بالذكاء الاصطناعي
  • أدوات الترجمة أو الإملاء في الوقت الفعلي
  • ألعاب لعب الأدوار التفاعلية التي تعتمد على الكلام

لوحة معلومات Traces تحصل على ترقية تركز على الصوت

تصور كل خطوة من خطوات التفاعل الصوتي

(أراضي البوديساتفا) آثار تم تحديث أداة التصحيح والمراقبة لدعم التصور الغني لجلسات وكيل الصوت في الوقت الفعلي.

إمكانيات لوحة المعلومات الجديدة:

  • عرض أشكال الموجات الصوتية لاستجابات المستخدم والوكيل
  • سجل استدعاءات أداة التسجيل ومعلماتها
  • تسليط الضوء على نقاط المقاطعة (على سبيل المثال، عندما يقاطع المستخدم في منتصف الجملة)

فوائد للمطورين: تصحيح الأخطاء بشكل أكثر وضوحًا، وتكرار أسرع، وتحسين أفضل لتجارب المستخدم الصوتية أولاً.


نموذج تحويل الكلام إلى كلام GPT-4o: أكثر ذكاءً وطبيعية

صوت أكثر ذكاءً، وتنفيذ مُحسَّن

لقد خضع نموذج الكلام GPT-4o لتحسينات واسعة النطاق لتعزيز فعاليته في مهام الصوت في الوقت الفعلي:

  • اتباع التعليمات بشكل أفضل - تنفيذ الأوامر بدقة أعلى
  • استخدام أداة أكثر اتساقًا - يقلل من التباين في استدعاء الأدوات
  • تحسين التعامل مع الانقطاعات - تعديلات ذكية في منتصف الحوار
  • سرعة الكلام قابلة للتعديل - جديد speed معلمة لضبط سرعة إخراج الصوت المرن

النماذج المتاحة:

  • gpt-4o-realtime-preview-2025-06-03 - مُحسّن لواجهة برمجة التطبيقات في الوقت الفعلي
  • gpt-4o-audio-preview-2025-06-03 - مصمم لإكمال الدردشة مع الصوت

تجعل هذه التحديثات أصوات الذكاء الاصطناعي أكثر طبيعية، وأكثر استجابة، وأسهل في التوجيه - سواء لإحاطات إخبارية سريعة الوتيرة أو حوار تعليمي بطيء.

الأفكار النهائية: عصر جديد لوكلاء الذكاء الاصطناعي الصوتي

من خلال هذه التحديثات الأربعة، تواصل OpenAI توسيع حدود تطوير وكلاء الذكاء الاصطناعي - مما يجعل الأمر أسهل وأكثر أمانًا ومرونة للمطورين لإنشاء مساعدين رقميين يشبهون الإنسان.

يوفر دمج دعم TypeScript والموافقات البشرية المباشرة وأطر عمل الوكيل الصوتي ونماذج الكلام المحدثة مجموعة أدوات كاملة لتصميم وكلاء أذكياء وتفاعليين وواعين بالسياق عبر المنصات والصناعات.

سواء كنت تقوم ببناء مساعد عملاء ممكّن صوتيًا، أو شخصية لعبة، أو مدرس افتراضي، فإن أحدث أدوات OpenAI تمنحك القدرة على القيام بذلك بشكل أسرع وأكثر ذكاءً من أي وقت مضى.

كيف تبدأ

يوفر CometAPI واجهة REST موحدة تجمع مئات نماذج الذكاء الاصطناعي، بما في ذلك عائلة ChatGPT، ضمن نقطة نهاية موحدة، مع إدارة مدمجة لمفاتيح واجهة برمجة التطبيقات، وحصص الاستخدام، ولوحات معلومات الفواتير. بدلاً من إدارة عناوين URL وبيانات اعتماد متعددة للموردين.

للبدء، استكشف قدرات النموذج في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API.

تم إصدار نموذج تحويل الكلام إلى كلام GPT-4o في CometAPI والذي gpt-4o-realtime-preview-2025-06-03 و gpt-4o-audio-preview-2025-06-03مرحباً بكم في الاتصال!

انظر أيضا واجهة برمجة تطبيقات GPT-4.1

اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%