OpenAI تصدر سلسلة GPT-5.4: ما الذي يغيره GPT-5.4

أحدث إصدارات OpenAI، GPT-5.4، يصل كعائلة نماذج موجهة لـ“العمل المهني” مع نسختين رئيسيتين — GPT-5.4 Thinking وGPT-5.4 Pro — وتركيز قوي على العمل ضمن سياقات طويلة للمستندات، وقدرات الاستخدام الأصلي للحاسوب (وكلاء)، وتحسين الحقائقيّة والأداء المهامي عبر سير عمل المكاتب والقانون والتمويل. يأتي هذا الإصدار عقب تحديثات سابقة في خط GPT-5 (لا سيما GPT-5.3 Instant وGPT-5.3-Codex) ويقدم تحسينات قابلة للقياس على المعايير الداخلية والعامة، وتكاملاً أعمق مع الأدوات (بما في ذلك مكوّن إضافي لـ ChatGPT من أجل Excel)، وسياقاً مدعوماً أكبر (يُشير إلى ما يصل إلى 1 مليون رمز).

الآن تدعم CometAPI GPT-5.4 وGPT-5.4 Pro، وتتيح استخدامهما مع خصومات.

ما هو GPT-5.4؟

التموضع والمتغيرات

تقدّم OpenAI نموذج GPT-5.4 بوصفه الأقوى ضمن سلسلة GPT-5 والمضبوط لسير عمل تتسم بـالاحترافية، وثقل المستندات، والطابع الوكيلي. ويُطرح على الأقل بنكهتين منشورتين:

GPT-5.4 Thinking — نسخة تركز على الاستدلال تكشف المزيد من عملية تفكير النموذج ومُحسّنة للاستدلال متعدد الخطوات والمهام الوكيلية (متاحة داخل ChatGPT كـ“وضع Thinking”).
GPT-5.4 Pro — طبقة استدلال ذات أولوية/حوسبة أعلى لأعباء العمل المؤسسية عالية الإنتاجية أو الحساسة لزمن الاستجابة، مع تسعير API أعلى (يعكس الحوسبة الإضافية).

تُبرز OpenAI قدرات الاستخدام الأصلي للحاسوب في GPT-5.4 — ما يمكّن النماذج من تشغيل البرمجيات عبر إجراءات الفأرة/لوحة المفاتيح البرمجية وتنظيم تسلسلات متعددة الأدوات — وتعتبره خطوة فارقة لبناء وكلاء ينجزون مهاماً فعلية.

القدرات الجديدة والمُؤكَّد عليها

دعم السياق الطويل: يُذكر أن GPT-5.4 يدعم سياقات كبيرة جداً (حتى 1,000,000 رمز في سياقات ChatGPT وCodex)، ما يمكّن النموذج من الاحتفاظ بمشاريع ضخمة أو كتب أو قواعد شيفرات أو مجموعات بيانات “في الذاكرة” خلال الجلسة. وهذا تحوّل جوهري لمراجعة المستندات، العقود القانونية، ومشاريع الهندسة متعددة الملفات.
الاستخدام الأصلي للحاسوب/الوكيلة: GPT-5.4 هو أول نموذج عام الغرض من OpenAI بقدرات استخدام أصلي للحاسوب — يمكنه توليد تسلسلات إجراءات واجهة المستخدم والشيفرة لتشغيل البرمجيات (مثلاً عبر Playwright أو بإصدار أوامر الفأرة/لوحة المفاتيح اعتماداً على لقطات الشاشة). صُممت هذه القدرة لتمكين المطورين من بناء وكلاء يكملون المهام عبر تطبيقات الويب وسطح المكتب.
تحسين مهارات المكاتب: تركيز كبير على جداول البيانات والعروض التقديمية والمستندات — حيث تُظهر المعايير الداخلية مكاسب كبيرة في نمذجة الجداول، وجماليات العروض، وجودة صياغة المستندات.
الحقائقيّة وتقليل الهلوسة: تُبلغ OpenAI عن انخفاض الأخطاء الواقعية مقارنة بالنماذج السابقة على مجموعات تقييم داخلية مُنتقاة (انظر المعايير أدناه).

مقارنةً بنماذج سابقة مثل GPT-5.2 Thinking وGPT-5.3 Codex، يدمج GPT-5.4 هذه القدرات في نموذج واحد مصمم للتعامل مع المهام طويلة الأمد وسير العمل المعقد مع أقل قدر من التدخل البشري.

الميزات الرئيسية واللمحات التقنية في GPT-5.4

1) نوافذ سياق هائلة (حتى 1,000,000 رمز)

أكثر القدرات ظهوراً هي دعم نوافذ سياق حتى 1,000,000 رمز عبر الـ API. هذا يوسّع ما يمكن أن تحتويه جلسة نموذج واحدة: كتب كاملة، قواعد شيفرات طويلة، أو ملفات متعددة كاملة دون تقطيع عبر استدعاءات عديدة. بالنسبة لسير العمل المعرفية الكثيفة في المؤسسات (اكتشاف قانوني، توليف بحوث، تحليل شيفرة واسع النطاق)، فإن القدرة على الحفاظ على سياق بمليون رمز تقلل “الغراء الهندسي” وتحسن الاتساق.

الأثر: سير العمل التي كانت تتطلب سابقاً تنسيقاً (استرجاع، تقطيع، ذاكرة خارجية) يمكنها الآن إبقاء المزيد من السياق الخام في ذاكرة عمل النموذج — ما يبسط خطوط المعالجة ويقلل مفاضلات الكمون/الاتساق.

2. الاستخدام الأصلي للحاسوب والأدوات

تُبرز OpenAI قدرة أقوى على تشغيل أدوات وبرابطات (مثل جداول البيانات، محررات المستندات، بيئات تنفيذ الشيفرة) بشكل أكثر متانة من النماذج السابقة. يطوّر GPT-5.4 أعمال “استخدام الأدوات” السابقة من خلال:

اختيار أدوات أفضل وضبط معلماتها بدقة.
تخطيط تسلسلي أكثر موثوقية عند استدعاء واجهات برمجة التطبيقات الخارجية أو اجتياز إجراءات شبيهة بواجهات المستخدم.
تقليل عبء الرموز لسير العمل الوكيلي عبر بنية نداء أدوات أكثر ذكاءً.

قدرات الوكالة والأدوات للمطورين:

أتمتة سطح المكتب والويب: مع دعم صريح لإصدار إجراءات الفأرة ولوحة المفاتيح بناءً على لقطات الشاشة، يمكن تضمين GPT-5.4 في وكلاء يشغّلون سير عمل برمجيات حقيقية (مثل تعبئة النماذج، التنقل في لوحات المعلومات، أو تشغيل إجراءات متعددة الخطوات). تُبلّغ OpenAI عن نتائج رائدة في معايير بأسلوب أنظمة التشغيل.
واجهة الأدوات وقابلية التوجيه: GPT-5.4 أكثر قابلية للتوجيه عبر رسائل المطورين ويمكنه أن يقرر بشكل أفضل متى وكيف يستدعي الأدوات والروابط وواجهات برمجة التطبيقات الخارجية — وهي قدرة حاسمة لبناء وكلاء متعدد الأدوات موثوقين يقللون الإجراءات غير الضرورية أو الخطرة.

الأثر العملي: مهام الأتمتة (مثل “افتح هذا الجدول، احسب هذه المحاور، أنشئ ملاحظات الشرائح”) تتطلب دورات فشل/إعادة محاولة أقل وإشرافاً بشرياً أدنى.

3) خمسة مستويات لجهد الاستدلال، أوضاع قصوى

تشير OpenAI إلى وجود مستويات متعددة لجهد الاستدلال — ما يسمح للمستخدمين بالمفاضلة بين زمن الاستجابة/الكلفة وبين تعمّق أكبر في الحوسبة الداخلية لسلسلة التفكير (تُسمّى أحياناً بشكل غير رسمي xhigh أو الاستدلال الشديد). تهدف هذه الأوضاع إلى مسائل يكون فيها مزيد من المداولات الداخلية مفيداً مادياً في تحسين الصحة (براهين معقدة، تحولات شيفرة طويلة، تحليلات مالية متعددة الخطوات). يعكس تسعير الـ API ومنطق الفوترة العمل الإضافي الذي يؤديه النموذج في هذه الأوضاع.

الأثر العملي: هذا الفصل يتيح للعملاء اختيار المفاضلات المناسبة لأعباء عملهم بدلاً من مطالبة نموذج واحد بأن يكون “كل شيء”.

4) الإنتاجية وتأليف المحتوى

نمذجة الجداول: يُظهر GPT-5.4 تحسينات قوية في مهام الجداول المحتمل استخدامها في التدقيق والمالية وسير عمل التحليل. تُبلغ OpenAI عن متوسط 87.3% على مهام داخلية بأسلوب “نمذجة المصرف الاستثماري” لـ GPT-5.4 مقابل 68.4% لـ GPT-5.2. هذه قفزة كبيرة في دقة المهام لنمذجة الأرقام وبناء الصيغ.
العروض والمخرجات المرئية: فضّل مقيّمو البشر العروض التي أنشأها GPT-5.4 بنسبة 68.0% مقارنةً بتلك من GPT-5.2 بسبب جمالية أفضل وتنوع أكبر وتكامل مع توليد الصور. يعكس ذلك تحسينات في المحتوى والشكل لإنتاج مجموعات الشرائح.
صياغة المستندات والكتابة الطويلة: تم تحسين GPT-5.4 للحفاظ على الاتساق عبر المستندات الطويلة، وسلوك اقتباس أفضل، وتناقضات داخلية أقل عند التعامل مع سياقات كبيرة، بفضل نافذة السياق الممتدة وضبط الاستدلال المخصص.

5) السلامة والتخفيفات واعتبارات الأمن السيبراني

تقليل الهلوسات: تُبلغ OpenAI أنه على مجموعة من المطالبات مجهولة الهوية التي أبلغ فيها المستخدمون عن أخطاء واقعية، فإن الادعاءات الفردية من GPT-5.4 أقل احتمالاً بنسبة 33% أن تكون خاطئة، وأن الاستجابات الكاملة أقل احتمالاً بنسبة 18% أن تحتوي على أي أخطاء، مقارنةً بـ GPT-5.2 — وهو مقياس رئيسي للتبني المؤسسي حيث تهم الدقة الواقعية.
تخفيفات الأمن السيبراني (نسخة Thinking): تُبرز GPT-5.4 Thinking مجموعة موسعة من التخفيفات للمخاطر السيبرانية، بناءً على الحمايات المستخدمة في نماذج Codex/5.3 السابقة. صُمم GPT-5.4 Thinking بحواجز إضافية لمواقف سوء الاستخدام عالية القدرة.

معايير الأداء — ماذا تقول الأرقام

نشرت OpenAI وعدة جهات نتائج مبكرة كجزء من الإطلاق. وبما أن معايير مختلفة تختبر قدرات مختلفة (التنقل على الويب مقابل المعرفة المتخصصة مقابل السلامة)، فمن المفيد تجميع الأرقام الرئيسية ومعانيها.

OpenAI تصدر سلسلة GPT-5.4: ما الذي يغيره GPT-5.4

تُظهر النتائج المعلنة تحسينات ملحوظة مقابل أفراد سابقين من عائلة GPT-5.x ومنافسة وثيقة مع نماذج الطراز الأول الأخرى.

معايير تفاعل الويب وسطح المكتب

WebArena-Verified (اختبارات استخدام المتصفح): حقق GPT-5.4 67.3% من النجاح عند استخدام كل من إشارات DOM ولقطات الشاشة، مقارنةً بـ 65.4% لـ GPT-5.2 — وهي قفزة مرئية لكنها ليست هائلة. يقيس هذا مهام يتعين فيها على النموذج التفاعل مع صفحات حية وعناصر واجهة.
Online-Mind2Web (مهام متصفح معتمدة على لقطات الشاشة): وصل GPT-5.4 إلى 92.8% نجاح باستخدام ملاحظات لقطات الشاشة فقط — تحسّن قوي مقارنةً بخطوط أساس نمط الوكلاء السابقة (قارنت OpenAI ذلك بأداء Agent Mode في ChatGPT Atlas).
OSWorld-Verified (التنقل على سطح المكتب): أشارت تقارير مستقلة إلى أن GPT-5.4 سجّل 75.0% على معيار يقيّم التنقل في بيئة سطح المكتب وإتمام المهام. وضعته تلك النتيجة أمام العديد من خطوط الأساس العامة لمهام الأتمتة من طرف إلى طرف.

الخلاصة: تظهر تحسّنات 5.4 أكثر وضوحاً حيث تهم فهم السياق البصري، إمكانات الواجهة، وتسلسلات الإجراءات الطويلة — أي في سير العمل الوكيلية.

معايير السلامة والصحة والمعرفة

تُظهر تقارير نشر السلامة لدى OpenAI إشارات متباينة:

HealthBench: سجّل GPT-5.4 62.6% على HealthBench (انخفاض طفيف من 63.3% لـ GPT-5.2)، ما يشير إلى مفاضلات دقيقة بين القدرة وبعض مقاييس التقييم الصحية في اللقطات التي أبلغت عنها OpenAI.
Hard: سجّل GPT-5.4 40.1% على مجموعة تقييم “Hard” (أقل قليلاً من 42.0%).
Consensus: حقق GPT-5.4 96.6% على “Consensus”، وهو مقياس يعكس الاتفاق مع إجابات توافقية مُنقّحة (زيادة بنحو ~2.1 نقطة).

كما أشارت OpenAI إلى تغييرات في متوسط طول الاستجابة على تقييمات الصحة (متوسط GPT-5.4 نحو ~3,311 حرفاً مقابل 2,676 لـ GPT-5.2)، ما قد يؤثر في كيفية معالجة النموذج للمواضيع الحساسة.

التفسير: تُظهر مقاييس السلامة والصحة أن 5.4 زاد إجمالاً من التوافق مع الإجماع وغيّر إطالة الإجابات، حتى مع انخفاض طفيف في بعض درجات الصحة الضيقة. غالباً ما يعكس هذا نمط إعادة موازنة أهداف النموذج — فقد تساعد الإجابات الأطول والأكثر حسماً في المنفعة والتوافق مع الحاجة إلى مراقبة دقيقة في المجالات الحساسة.

أمثلة وادعاءات خاصة بالمجالات

قدمت الاختبارات المبكرة ادعاءات ملموسة خاصة بالمجالات (من OpenAI ومصادر طرف ثالث):

معيار الاستدلال القانوني (BigLaw Bench) — حقق GPT-5.4 حوالي 91% على شرائح الاستدلال القانوني في اختبارات مبكرة، وهو مؤشر قوي لمهام تحليل المستندات؛ يُرجى ملاحظة أن هذه أرقام مبكرة وغير مُحكّمة.
خفض الهلوسة: استجابات GPT-5.4 أقل بنحو ~33% احتواءً على ادعاءات خاطئة وأقل بنحو ~18% احتواءً على أخطاء واقعية مقارنةً بخطوط أساس سابقة معينة. تم تسليط الضوء على هذه النسب في تقارير ثانوية واتصالات الشركة؛ وكأي ادعاء كهذا، فهي تعتمد على مجموعة المعايير ومنهجية أخذ العينات.

كيفية الحصول على GPT-5.4 والدفع له

فئات ChatGPT والوصول المؤسسي

وفقاً لـ OpenAI والتقارير عن المنتج:

كان مستخدمو ChatGPT Plus / Team / Pro أول من تلقى GPT-5.4 Thinking في المنتج. يمكن لمسؤولي Enterprise وEducation تمكين الوصول المبكر عبر عناصر التحكم الإدارية. لا يُضمن لمستخدمي Free/Go الوصول الفوري. يمكن للمطورين استدعاء نقاط النهاية gpt-5.4 وgpt-5.4-pro عبر الـ API.

لمحة عن تسعير واجهة البرمجة (التسعير المنشور للمطورين)

تدرج تسعيرة مطوري OpenAI نموذج GPT-5.4 كنموذج طليعي مع رسوم لكل رمز. وكما نُشر في صفحة التسعير العامة وقت الإعلان، كانت المعدلات التقريبية لـ GPT-5.4 كالتالي:

Model	Input	Cached input	Output
gpt-5.4 (<272K context length)	$2.50	$0.25	$15.00
gpt-5.4 (>272K context length)	$5.00	$0.50	$22.50
gpt-5.4-pro (<272K context length)	$30.00		$180.00
gpt-5.4-pro (>272K context length)	$60.00		$270.00

في CometAPI (منصة تجميع شاملة لواجهات نماذج الذكاء الكبيرة):

Model	Comet Price (USD / M Tokens)	Official Price (USD / M Tokens)	Discount
gpt-5.4	Input:$2/M; Output:$16/M	Input:$2.5/M; Output:$20/M	-20%
gpt-5.4-pro	Input:$24/MOutput:$192/M	Input:$30/MOutput:$240/M	-20%

لذلك، أوصي بشدة بـ CometAPI، إذ يمكن أن يقلل كثيراً من تكاليف واجهة البرمجة.

اعتبارات إدارة التكلفة

إذا كنت تخطط لاستخدام النموذج على نطاق واسع، خصوصاً في إعدادات المستندات الطويلة أو الإنتاجية العالية، فعليك النظر في:

التخزين المؤقت وإزالة التكرار للمدخلات (لاستخدام تسعير الإدخال المخبأ حيثما أمكن).
هندسة الحث لضغط السياق وتجنب الرموز المكررة.
استراتيجيات التجميع والمعالجة اللاحقة التي تقلل من توليد الإخراج المكلف.
مراقبة استخدام وضع الاستدلال، لأن الأوضاع الأعمق قد تحمل كلفة حوسبية أعلى.

المقارنة: GPT-5.4 مقابل GPT-5.3

أين يتفوق GPT-5.4 على GPT-5.3

عمق الاستدلال وتنظيم الأدوات: تم ضبط 5.4 Thinking صراحةً ليتفوق على 5.3 في الاستدلال متعدد الخطوات والاستخدام الوكيلي. يظهر ذلك في معايير تفاعل الويب/سطح المكتب ومقاييس نجاح الوكلاء.
سعة السياق: عرض 1M رمز في 5.4 خطوة تقنية واضحة تتجاوز ما وفره 5.3 في التوافر العام للـ API، ما يمكّن فئات جديدة من المهام ضمن جلسة واحدة.
رفعات الأداء في المجالات: تشير أرقام OpenAI المبكرة وتقارير طرف ثالث إلى تحسينات على بعض معايير القانون والمستندات، حيث يساعد السياق الأطول والضبط المتخصص في 5.4.

المقايضات وحالات قد يكون فيها 5.3 مفضلاً

استخدام محادثي خفيف: يظل GPT-5.3 Instant مُحسّناً لتدفقات محادثة سريعة واقتصادية؛ قد تفضله المؤسسات الساعية لأدنى كمون/كلفة للتفاعلات القصيرة.
استقرار مقاييس السلامة: أظهرت بعض درجات الصحة و“hard” انخفاضات طفيفة لـ 5.4 مقابل 5.2 في لقطات OpenAI؛ ينبغي للمؤسسات في مجالات حساسة منظّمة التحقق من النموذج على مجموعات تقييمها الخاصة قبل النشر الكامل.

حالات الاستخدام والآثار على الصناعة

يجمع GPT-5.4 بين الاستدلال العميق، ذاكرة السياق الطويلة، واستخدام الأدوات، ما يفتح فرصاً عملية واستراتيجية عدة.

1. الخدمات المهنية والاستشارات

يمكن للشركات التي تُنتج مخرجات طويلة (مثل مذكرات قانونية، تقارير استشارية متعددة الفصول، حزم تدقيق M&A) الاحتفاظ بالمستندات ومجموعات البيانات كاملة في السياق، ما يسمح بتوليف متسق عبر المستندات، وضمان جودة تلقائي، وتوليد ملخصات تنفيذية دون خياطة يدوية للمقاطع. تتماشى الانتصارات على APEX-Agents مع هذا التموضع.

2. هندسة البرمجيات والاستدلال على قواعد الشيفرة

يعني السياق الأطول أن مكالمة نموذج واحدة يمكن أن تتضمن مستودعات كاملة أو مسارات طويلة من السجلات. تُشير تحسينات GPT-5.4 على معايير SWE إلى أداء أفضل لتصحيح الأخطاء، وإعادة الهيكلة، ومراجعات الشيفرة — خاصّة عند اقترانه بنسخة Pro للأحمال المستمرة.

3. الوكلاء الذاتيون والأتمتة المؤسسية

تستفيد الأنظمة الوكيلية التي تعمل عبر أدوات (جداول، أنظمة تذاكر، واجهات ويب) من تحسينات GPT-5.4 في اختيار الأدوات، وتقليل عبء الرموز لسير العمل الوكيلي، وتحسين حفظ الحالة طويلة الأمد. هذا يجعل GPT-5.4 جذاباً لخطوط أتمتة المؤسسات و“المساعدين الذين يتصرفون” عبر أنظمة متعددة.

الخلاصة — ما الذي يغيّره GPT-5.4

يمثل GPT-5.4 تقدماً عملياً مدفوعاً بالقدرات نحو نماذج يمكنها التعامل مع استدلال طويل متعدد المستندات، وتنفيذ سير عمل وكيلية بموثوقية أكبر، وتوسيع النطاق في خطوط العمل الاحترافية عبر عقود Pro. بالنسبة للمؤسسات التي تتسم سير أعمالها بأفق طويل واعتماد على الأدوات، يعد GPT-5.4 قفزة في إمكانات الإنتاجية.

يمكن للمطورين الوصول إلى GPT-5.4، GPT-5.4-pro، و GPT 5.3 Chat عبر CometAPI الآن. للبدء، استكشف قدرات النموذج في Playground وراجع دليل API للحصول على تعليمات مفصلة. قبل الوصول، يرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. تقدّم CometAPI سعراً أقل بكثير من السعر الرسمي لمساعدتك على الاندماج.

هل أنت جاهز للانطلاق؟→ سجّل الاشتراك في GPT-5.4 اليوم !

إذا كنت ترغب في معرفة المزيد من النصائح والإرشادات والأخبار حول الذكاء الاصطناعي، تابعنا على VK، وX، وDiscord!