GPT-5-Codex هو إصدار جديد من OpenAI مُركّز على الهندسة من GPT-5، مُصمّم خصيصًا لهندسة البرمجيات الوكيلة ضمن مجموعة منتجات Codex. صُمّم هذا الإصدار ليتولى مهام هندسية عملية واسعة النطاق: إنشاء مشاريع كاملة من الصفر، وإضافة ميزات واختبارات، وتصحيح الأخطاء، وإعادة هيكلة، ومراجعة الكود مع التفاعل مع أدوات خارجية ومجموعات اختبار. يُمثّل هذا الإصدار تحسينًا مُستهدفًا للمنتج وليس نموذجًا أساسيًا جديدًا كليًا: قامت OpenAI بدمج GPT-5-Codex في Codex CLI، وامتداد Codex IDE، وCodex Cloud، وسير عمل GitHub، وتجارب ChatGPT على الأجهزة المحمولة؛ ومن المُخطط توفير واجهة برمجة التطبيقات (API) ولكن ليس فورًا.
ما هو GPT-5-Codex ولماذا هو موجود؟
GPT-5-Codex هو GPT-5 "المتخصص في الترميز". بدلًا من أن يكون مساعدًا حواريًا عامًا، فهو مُعدّل ومُدرّب باستخدام التعلم المُعزّز ومجموعات بيانات هندسية مُحدّدة لدعم مهام الترميز التكرارية المُساعدة بالأدوات بشكل أفضل (مثل: تشغيل الاختبارات، والتكرار عند الفشل، وإعادة هيكلة الوحدات، واتباع معايير العلاقات العامة). تُصنّفه OpenAI كخليفة لجهود Codex السابقة، ولكنه مبني على أساس GPT-5 لتحسين دقة التفكير في قواعد البيانات الكبيرة، ولتنفيذ مهام هندسية متعددة الخطوات بشكل أكثر موثوقية.
الدافع عملي: تعتمد سير عمل المطورين بشكل متزايد على وكلاء يمكنهم القيام بأكثر من مجرد اقتراحات مقتطفات فردية. من خلال مواءمة نموذج ما تحديدًا مع حلقة "إنشاء ← تشغيل الاختبارات ← الإصلاح ← التكرار" ومعايير العلاقات العامة التنظيمية، تهدف OpenAI إلى إنشاء ذكاء اصطناعي يشعر وكأنه زميل في الفريق بدلًا من أن يكون مصدرًا للإكمالات لمرة واحدة. هذا التحول من "إنشاء وظيفة" إلى "إضافة ميزة" هو القيمة الفريدة للنموذج.
كيف يتم تصميم GPT-5-Codex وتدريبه؟
الهندسة المعمارية عالية المستوى
GPT-5-Codex هو إصدارٌ مُشتقٌ من بنية GPT-5 (سلسلة GPT-5 الأوسع) وليس بنيةً جديدةً من البداية. هذا يعني أنه يرث تصميم GPT-5 الأساسي القائم على المحولات، وخصائص التوسع، وتحسينات الاستدلال، ولكنه يضيف تدريبًا خاصًا بـ Codex وضبطًا دقيقًا قائمًا على التعلم المعزز مُخصصًا لمهام هندسة البرمجيات. يصف ملحق OpenAI GPT-5-Codex بأنه مُدرَّب على مهام هندسية واقعية ومعقدة، ويُركز على التعلم المُعزَّز في البيئات التي يتم فيها تنفيذ الكود والتحقق من صحته.
كيف تم تدريبه وتحسينه للكود؟
يركز نظام تدريب GPT-5-Codex على مهام هندسية في العالم الحقيقييستخدم هذا البرنامج أسلوب الضبط الدقيق المُعزَّز لمجموعات البيانات والبيئات المُنشأة من سير عمل تطوير برمجيات ملموسة: إعادة هيكلة الملفات المتعددة، ومقارنة الفروقات بين طلبات العلاقات العامة، وتشغيل مجموعات الاختبارات، وجلسات تصحيح الأخطاء، وإشارات المراجعة البشرية. يهدف التدريب إلى تعظيم دقة تعديلات الكود، واجتياز الاختبارات، وإنتاج تعليقات مراجعة تتسم بدقة عالية وأهمية بالغة. هذا التركيز هو ما يُميز Codex عن الضبط الدقيق المُوجَّه نحو الدردشة: حيث تتوافق دوال الخسارة، وأدوات التقييم، وإشارات المكافأة مع نتائج الهندسة (اجتياز الاختبارات، ومقارنة الفروقات الصحيحة، وتقليل التعليقات الزائفة).
كيف يبدو التدريب "الوكيل"
- الضبط الدقيق الموجه نحو التنفيذيتم تدريب النموذج في سياقات يتم فيها تنفيذ الكود المُولَّد واختباره وتقييمه. تأتي حلقات التغذية الراجعة من نتائج الاختبار وإشارات التفضيل البشري، مما يشجع النموذج على التكرار حتى يجتاز مجموعة الاختبارات.
- التعلم المعزز من التغذية الراجعة البشرية (RLHF):مشابه في روحه لعمل RLHF السابق، ولكن يتم تطبيقه على مهام الترميز متعددة الخطوات (إنشاء العلاقات العامة، وتشغيل الاختبارات، وإصلاح الإخفاقات)، بحيث يتعلم النموذج تعيين الائتمان الزمني على مدى سلسلة من الإجراءات.
- سياق مقياس المستودع:يتضمن التدريب والتقييم مستودعات ضخمة وإعادة هيكلة، مما يساعد النموذج على تعلم التفكير بين الملفات، واتفاقيات التسمية، والتأثيرات على مستوى قاعدة التعليمات البرمجية. ()
كيف يتعامل GPT-5-Codex مع استخدام الأدوات والتفاعلات البيئية؟
من أهم ميزات هيكلية النموذج تحسين قدرته على استدعاء الأدوات وتنسيقها. دأبت Codex على دمج مخرجات النموذج مع نظام تشغيل/وكيل صغير قادر على تشغيل الاختبارات وفتح الملفات واستدعاء البحث. ويوسع GPT-5-Codex هذا من خلال تعلم متى يجب استدعاء الأدوات، ودمج ملاحظات الاختبار بشكل أفضل في عمليات توليد الكود اللاحقة، مما يُغلق الحلقة بين التوليف والتحقق بفعالية. ويتحقق ذلك من خلال التدريب على مسارات يُصدر فيها النموذج إجراءات (مثل "تشغيل الاختبار X") ويشترط على الأجيال اللاحقة مخرجات الاختبار والاختلافات.
ما الذي يمكن أن يفعله GPT-5-Codex فعليًا - ما هي ميزاته؟
أحد أهم ابتكارات المنتجات هو مدة التفكير التكيفييُعدّل GPT-5-Codex مقدار الاستدلال الخفي الذي يُجريه: فالطلبات البسيطة تُنفَّذ بسرعة وبتكلفة منخفضة، بينما تُتيح عمليات إعادة الهيكلة المعقدة أو المهام طويلة الأمد للنموذج "التفكير" لفترة أطول. في الوقت نفسه، بالنسبة للوظائف التفاعلية الصغيرة، يستهلك النموذج رموزًا أقل بكثير من مثيل GPT-5 متعدد الأغراض، حيث يوفر 93.7% من الرموز (بما في ذلك الاستدلال والمخرجات) مقارنةً بـ GPT-5. تهدف استراتيجية الاستدلال المتغير هذه إلى إنتاج استجابات سريعة عند الحاجة وتنفيذ عميق وشامل عند الحاجة.
القدرات الأساسية
- إنشاء المشروع والتمهيد له: إنشاء هياكل المشروع الكاملة باستخدام CI والاختبارات والوثائق الأساسية من المطالبات عالية المستوى.
- الاختبار الوكيل والتكرار: إنشاء التعليمات البرمجية، وتشغيل الاختبارات، وتحليل الإخفاقات، وتصحيح التعليمات البرمجية، وإعادة التشغيل حتى اجتياز الاختبارات — مما يؤدي فعليًا إلى أتمتة أجزاء من حلقة التحرير → الاختبار → الإصلاح الخاصة بالمطور.
- إعادة الهيكلة على نطاق واسع: نفّذ عمليات إعادة هيكلة منهجية للعديد من الملفات مع الحفاظ على السلوك والاختبارات. هذا مجال تحسين مُعلن لـ GPT-5-Codex مقارنةً بـ GPT-5 العامة.
- مراجعة الكود وتوليد العلاقات العامة: إنتاج أوصاف العلاقات العامة، والتغييرات المقترحة مع الاختلافات، ومراجعة التعليقات التي تتوافق مع اتفاقيات المشروع وتوقعات المراجعة البشرية.
- استدلال الكود في السياق الكبير: أفضل في التنقل والتفكير حول قواعد بيانات الملفات المتعددة، ورسوم التبعيات، وحدود واجهة برمجة التطبيقات مقارنة بنماذج الدردشة العامة.
- المدخلات والمخرجات المرئية: عند العمل في السحابة، يمكن لـ GPT-5-Codex قبول الصور/لقطات الشاشة، وفحص التقدم بصريًا، وإرفاق القطع الأثرية المرئية (لقطات شاشة واجهة المستخدم المضمنة) بالمهام - وهي ميزة عملية لتصحيح أخطاء الواجهة الأمامية وسير عمل ضمان الجودة المرئي.
تكامل المحرر وسير العمل
تم دمج Codex بشكل عميق في سير عمل المطورين:
- كود سطر الأوامر — تفاعل مباشر مع الجهاز، يدعم لقطات الشاشة، وتتبع المهام، وموافقات الوكيل. واجهة سطر الأوامر مفتوحة المصدر ومُصممة خصيصًا لسير عمل الترميز الوكيل.
- ملحق Codex IDE — يقوم بتضمين الوكيل في VS Code (والشوك) حتى تتمكن من معاينة الاختلافات المحلية وإنشاء مهام سحابية ونقل العمل بين السياقات السحابية والمحلية مع الحفاظ على الحالة.
- Codex Cloud / GitHub — يمكن تكوين مهام السحابة لمراجعة طلبات السحب تلقائيًا، وإنشاء حاويات مؤقتة للاختبار، وإرفاق سجلات المهام ولقطات الشاشة بخيوط طلبات السحب.
القيود والمقايضات الملحوظة
- التحسين الضيق:بعض تقييمات الإنتاج غير المشفرة أقل قليلاً بالنسبة لـ GPT-5-Codex مقارنة بالمتغير العام لـ GPT-5 - وهو تذكير بأن التخصص يمكن أن يتنازل عن العمومية.
- اختبار الاعتماديعتمد سلوك الوكيل على الاختبارات الآلية المتاحة. قواعد البيانات البرمجية ذات تغطية الاختبارات الضعيفة ستُظهر حدودًا في التحقق الآلي، وقد تتطلب إشرافًا بشريًا.
ما هي أنواع المهام التي يجيدها GPT-5-Codex بشكل خاص أو يفشل فيها؟
جيد في: إعادة صياغة معقدة، وإنشاء هيكل للمشروعات الكبيرة، وكتابة الاختبارات وإصلاحها، واتباع توقعات العلاقات العامة، وتشخيص مشكلات وقت تشغيل الملفات المتعددة.
أقل جودة في: المهام التي تتطلب معرفة داخلية حديثة أو خاصة لا تتوفر في بيئة العمل، أو تلك التي تتطلب دقة عالية دون مراجعة بشرية (لا تزال الأنظمة الحساسة للسلامة بحاجة إلى خبراء). كما تشير المراجعات المستقلة إلى تباين في جودة الكود الخام مقارنةً بنماذج الترميز المتخصصة الأخرى - فنقاط القوة في سير العمل الوكيل لا تُترجم بشكل موحد إلى دقة هي الأفضل في فئتها في كل معيار.
ماذا تكشف الاختبارات المعيارية عن أداء GPT-5-Codex؟
SWE-bench / SWE-bench تم التحقق منهصرحت OpenAI بأن GPT-5-Codex يتفوق على GPT-5 في معايير الترميز الوكيلية مثل SWE-bench Verified، ويُظهر تحسنًا في مهام إعادة هيكلة الكود المأخوذة من مستودعات كبيرة. في مجموعة بيانات SWE-bench Verified، التي تحتوي على 500 مهمة هندسة برمجيات واقعية، حقق GPT-5-Codex نسبة نجاح بلغت 74.5%. هذا يتفوق على GPT-5 بنسبة 72.8% في نفس المعيار، مما يُبرز قدرات الوكيل المُحسّنة. 500 مهمة برمجة من مشاريع مفتوحة المصدر حقيقية. في السابق، كان من الممكن اختبار 477 مهمة فقط، ولكن الآن يُمكن اختبار جميع المهام الـ 500 → نتائج أكثر اكتمالًا.

من إعدادات GPT-5 السابقة إلى GPT-5-Codex، ارتفعت درجات تقييم إعادة هيكلة الكود بشكل ملحوظ - أرقام مثل التحول من حوالي 34% إلى حوالي 51% على مقياس إعادة هيكلة محدد عالي الإسهاب تم تسليط الضوء عليها في التحليلات المبكرة. هذه المكاسب ذات مغزى لأنها تعكس تحسنًا في إعادة صياغة كبيرة وواقعية بدلاً من الأمثلة التجريبية - ولكن تظل هناك تحذيرات بشأن إمكانية إعادة الإنتاج وتسخير الاختبار الدقيق.
كيف يمكن للمطورين والفرق الوصول إلى GPT-5-Codex؟
قامت OpenAI بدمج GPT-5-Codex في منتجات Codex: فهو متاح أينما يعمل Codex اليوم (على سبيل المثال، واجهة سطر أوامر Codex وتجارب Codex المدمجة). بالنسبة للمطورين الذين يستخدمون Codex عبر سطر الأوامر وتسجيل الدخول عبر ChatGPT، ستُظهر تجربة Codex المُحدثة نموذج GPT-5-Codex. صرحت OpenAI بأن النموذج سيتوفر قريبًا في واجهة برمجة التطبيقات الأوسع لمن يستخدمون مفاتيح API، ولكن اعتبارًا من الطرح الأولي، يكون مسار الوصول الرئيسي عبر أدوات Codex بدلاً من نقطة نهاية واجهة برمجة التطبيقات العامة.
كود سطر الأوامر
فعّل Codex لمراجعة مسودات طلبات السحب في مستودع معزول، لتتمكن من تقييم جودة التعليقات دون أي مخاطرة. استخدم أساليب الموافقة بحذر.
- تم إعادة تصميمه حول سير عمل الترميز الوكيل.
- يوفر دعم إرفاق الصور (مثل الإطارات السلكية والتصميمات ولقطات شاشة أخطاء واجهة المستخدم) سياقًا للنماذج.
- تمت إضافة ميزة قائمة المهام لتتبع تقدم المهام المعقدة.
- توفير دعم الأدوات الخارجية (البحث على الويب، اتصال MCP).
- تعمل واجهة المحطة الطرفية الجديدة على تحسين استدعاء الأدوات وتنسيق الاختلافات، وتم تبسيط وضع الأذونات إلى ثلاثة مستويات (القراءة فقط، والتلقائية، والوصول الكامل).

امتداد IDE
التكامل مع سير عمل IDE: أضف ملحق Codex IDE للمطورين الذين يرغبون في معاينات مضمنة وتكرار أسرع. نقل المهام بين السحابة والنسخة المحلية مع الحفاظ على السياق يُقلل من الاحتكاك بالميزات المعقدة.
- يدعم VS Code، وCursor، والمزيد.
- قم باستدعاء Codex مباشرة من المحرر للاستفادة من سياق الملف والرمز المفتوحين حاليًا للحصول على نتائج أكثر دقة.
- التبديل بسلاسة بين المهام بين البيئات المحلية والسحابية، مع الحفاظ على استمرارية السياق.
- يمكنك عرض نتائج مهام السحابة والعمل عليها مباشرةً في المحرر، دون الحاجة إلى تبديل الأنظمة الأساسية.

تكامل GitHub ووظائف السحابة
- مراجعة العلاقات العامة الآلية: يتم تشغيل التقدم تلقائيًا من المسودة إلى الجاهزية.
- يدعم المطورين لطلب المراجعات المستهدفة مباشرة في قسم @codex في طلب السحب.
- بنية تحتية سحابية أسرع بشكل ملحوظ: قم بتقليص أوقات الاستجابة للمهام بنسبة 90% من خلال التخزين المؤقت للحاويات.
- تكوين البيئة التلقائية: تنفيذ نصوص الإعداد وتثبيت التبعيات (على سبيل المثال، pip install).
- يقوم بتشغيل المتصفح تلقائيًا، والتحقق من تنفيذات الواجهة الأمامية، وإرفاق لقطات الشاشة بالمهام أو طلبات السحب.

ما هي اعتبارات السلامة والأمن والحدود؟
تؤكد OpenAI على طبقات متعددة من التخفيف لوكلاء Codex:
- التدريب على مستوى النموذج: تدريب مستهدف على السلامة لمقاومة الحقن الفوري والحد من السلوكيات الضارة أو عالية الخطورة.
- عناصر التحكم على مستوى المنتج: سلوك افتراضي معزول، ووصول شبكي قابل للتكوين، وأنماط موافقة لتشغيل الأوامر، وسجلات طرفية واستشهادات للتتبع، وإمكانية طلب موافقات بشرية للإجراءات الحساسة. كما نشرت OpenAI "ملحق بطاقة النظام" الذي يصف هذه الإجراءات التخفيفية وتقييمات مخاطرها، وخاصةً فيما يتعلق بالقدرات في المجالين البيولوجي والكيميائي.
تعكس هذه الضوابط حقيقة مفادها أن العميل القادر على تشغيل الأوامر وتثبيت التبعيات لديه سطح هجوم ومخاطر في العالم الحقيقي - يتمثل نهج OpenAI في الجمع بين تدريب النموذج وقيود المنتج للحد من سوء الاستخدام.
ما هي القيود المعروفة؟
- ليس بديلاً عن المراجعين البشريين: توصي OpenAI صراحةً باستخدام Codex كـ إضافي المراجع، وليس بديلاً. يبقى الإشراف البشري بالغ الأهمية، خاصةً في قرارات الأمن والترخيص والهندسة المعمارية.
- المعايير والمطالبات تحتاج إلى قراءة متأنية: أشار المراجعون إلى اختلافات في مجموعات التقييم الفرعية، وإعدادات الإسهاب، وتوازنات التكلفة عند مقارنة النماذج. تشير الاختبارات المستقلة المبكرة إلى نتائج متباينة: يُظهر Codex سلوكًا قويًا للوكيل وتحسينات في إعادة الهيكلة، لكن الدقة النسبية مقارنةً بالموردين الآخرين تختلف باختلاف المعيار والتكوين.
- الهلوسة والسلوك المتقلب: كما هو الحال مع جميع برامج الماجستير في القانون، قد يُصاب Codex بالهلوسة (اختراع عناوين URL، وتفسير خاطئ لبيانات التبعيات)، وقد يواجه تشغيله لساعات طويلة بعض الهشاشة في بعض الحالات. توقع التحقق من صحة مخرجاته من خلال الاختبارات والمراجعة البشرية.
ما هي الآثار الأوسع على هندسة البرمجيات؟
يوضح GPT-5-Codex تحولاً ناضجًا في تصميم LLM: بدلاً من تحسين قدرات اللغة المجردة فقط، يعمل البائعون على التحسين سلوك للمهام الطويلة والوكيلة (التنفيذ لعدة ساعات، التطوير القائم على الاختبار، خطوط المراجعة المتكاملة). هذا يُغيّر وحدة الإنتاجية من مُقتطف مُولّد واحد إلى إنجاز المهمة قدرة النموذج على قبول طلب، وإجراء مجموعة من الاختبارات، وإنتاج تطبيق مُعتمد بشكل متكرر. إذا أصبحت هذه الوكلاء قوية ومنظمة بشكل جيد، فسيُعيدون تشكيل سير العمل (عدد أقل من عمليات إعادة الهيكلة اليدوية، ودورات علاقات عامة أسرع، ووقت المطور مُركز على التصميم والاستراتيجية). لكن هذا التحول يتطلب تصميمًا دقيقًا للعمليات، وإشرافًا بشريًا، وحوكمة أمنية.
الخاتمة - ما الذي يجب عليك أن تأخذه معك؟
GPT-5-Codex هي خطوة مركزة نحو درجة هندسية ماجستير في القانون: نسخة GPT-5 مُدربة ومُعدّلة ومُنتجة لتكون بمثابة وكيل ترميز كفؤ داخل منظومة Codex. تُقدّم هذه النسخة سلوكيات جديدة ملموسة - وقت استدلال تكيفي، عمليات تشغيل ذاتية طويلة، تنفيذ مُدمج في بيئة اختبار، وتحسينات مُستهدفة لمراجعة الكود - مع الحفاظ على المُحاذير المألوفة لنماذج اللغة (الحاجة إلى إشراف بشري، وتفاصيل التقييم الدقيقة، والهلوسة العرضية). بالنسبة للفرق، المسار الأمثل هو التجارب المُدروسة: تجربة على مستودعات آمنة، ومراقبة مقاييس النتائج، ودمج الوكيل في سير عمل المُراجع تدريجيًا. مع توسّع OpenAI في الوصول إلى واجهات برمجة التطبيقات وانتشار معايير الجهات الخارجية، يجب أن نتوقع مقارنات أوضح وإرشادات أكثر واقعية حول التكلفة والدقة وحوكمة أفضل الممارسات.
كيف تبدأ
CometAPI هي منصة واجهات برمجة تطبيقات موحدة تجمع أكثر من 500 نموذج ذكاء اصطناعي من مزودين رائدين، مثل سلسلة GPT من OpenAI، وGoogle Gemini، وClude من Anthropic، وMidjourney، وSuno، وغيرهم، في واجهة واحدة سهلة الاستخدام للمطورين. من خلال توفير مصادقة متسقة، وتنسيق الطلبات، ومعالجة الردود، تُبسط CometAPI بشكل كبير دمج قدرات الذكاء الاصطناعي في تطبيقاتك. سواء كنت تُنشئ روبوتات دردشة، أو مُولّدات صور، أو مُلحّنين موسيقيين، أو خطوط أنابيب تحليلات قائمة على البيانات، تُمكّنك CometAPI من التكرار بشكل أسرع، والتحكم في التكاليف، والاعتماد على مورد واحد فقط، كل ذلك مع الاستفادة من أحدث التطورات في منظومة الذكاء الاصطناعي.
يمكن للمطورين الوصول واجهة برمجة تطبيقات GPT-5-Codex من خلال CometAPI، تُعرض أحدث نماذج CometAPI اعتبارًا من تاريخ نشر المقال. قبل الوصول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API.



