وضع الوكيل هو خطوة OpenAI لتحويل ChatGPT من مساعد محادثة إلى اتخاذ الإجراءات العامل الرقمي: ذكاء اصطناعي قادر على التفكير، والتصفح، وتشغيل الأكواد البرمجية، ومعالجة الملفات، واتخاذ إجراءات تدريجية نيابةً عنك داخل بيئة مُتحكم بها ومعزولة. بدلاً من الاكتفاء بالإجابة على الأسئلة أو كتابة النصوص، يمكن للوكيل تنفيذ مهام متعددة الخطوات بشكل مستقل - على سبيل المثال، البحث في موضوع عبر مواقع متعددة، أو ملء نموذج ويب، أو إنشاء عرض تقديمي من مصادر مُجمعة، أو تشغيل نصوص برمجية لتحليل جدول بيانات - مع عرض ما يفعله وطلب الإذن قبل اتخاذ الإجراءات اللازمة. هذا التحول هو جوهر مفهوم الوكيل: الجمع بين فهم اللغة واستخدام الأدوات و"مساحة عمل" افتراضية، بحيث يمكن للنموذج do الأشياء بدلاً من مجرد إخبارك بكيفية القيام بها.
ما هو الوكيل بالضبط في ChatGPT؟
الوكيل في ChatGPT هو إمكانية مُجمّعة تُتيح للنموذج الوصول إلى بيئة تشغيل معزولة: متصفح افتراضي، ومحطة طرفية، ومساحة عمل ملفات، وموصلات لخدمات خارجية مُختارة. يقبل الوكيل تعليمات باللغة الطبيعية (مثل: "خطط لرحلة لمدة 3 أيام إلى كيوتو بميزانية 800 دولار")، ويُقسّم هذا الهدف عالي المستوى إلى مهام فرعية، ويُجري بحثًا على الويب وتفاعلات، ويُجري تعديلات على الملفات أو الأكواد البرمجية عند الحاجة، ويُعيد مُخرجات مُكتملة - مع عرض توضيحي لكل خطوة على الشاشة لمزيد من الشفافية. يُمكن للمستخدم مُقاطعة الوكيل، أو التحكم فيه، أو تقييده.
كيف يختلف الوكلاء عن محادثات ChatGPT الكلاسيكية
جلسات ChatGPT التقليدية عبارة عن تبادلات نصية بدون جنسية (بالإضافة إلى أدوات الذاكرة/التكوين). يوفر وضع الوكيل بيئة تنفيذ محمية الذي يسمح للمساعد بمحاكاة التفاعلات البشرية مع مواقع الويب والملفات - النقر والتمرير وتشغيل التعليمات البرمجية - مما يسمح له إكمال مهام كانت تتطلب سابقًا تدخلًا بشريًا لإتمام خطواتها النهائية. تخيل الأمر كأنك تمنح ChatGPT "كمبيوترًا محمولًا افتراضيًا" آمنًا.
كيف يعمل وضع الوكيل
بيئة التشغيل: ماذا يعني "sandboxed"؟
يعمل الوكلاء داخل بيئة خاضعة للرقابة وزائلة: متصفح معزول، ومحطة طرفية لتشغيل مقتطفات برمجية صغيرة، ومساحة عمل للملفات. تعني "البيئة المعزولة" أن البيئة تعزل إجراءات الوكيل عن جهازك المحلي وتفرض عمليات فحص الأذونات قبل التفاعل مع الخدمات الخارجية الحساسة. يوفر صندوق الحماية إمكانية الرؤية (سجل نشاط أو سرد) حتى تتمكن من رؤية ما يفعله الوكيل في الوقت الفعلي وإيقافه أو توليه في أي وقت.
المكونات الأساسية لأنظمة وضع وكيل ChatGPT
1. طبقة التخطيط/التفكير (الدماغ)
هذا هو المخطط المُدار من قِبل برنامج ماجستير إدارة الأعمال، والذي يُحلل هدف المستخدم رفيع المستوى إلى سلسلة من الخطوات، ويُحدد الأدوات التي يجب استخدامها، ويراقب التقدم. يُفكر في الأولويات، ومعالجة الأخطاء، وطرح أسئلة توضيحية.
2. الأدوات والموصلات (الأيدي)
يستخدم الوكلاء مجموعة من "الأدوات": متصفح مرئي يتفاعل مع صفحات الويب، ومحركات تنفيذ التعليمات البرمجية (مثل Python REPL)، وقارئات/كاتبات الملفات (للمستندات وجداول البيانات والصور)، وموصلات لمصادر بيانات خارجية (البريد الإلكتروني، وجوجل درايف، وGitHub، وأنظمة إدارة علاقات العملاء) عند تفعيلها. الوصول إلى هذه الأدوات مقيد بأذونات المستخدم.
3. بيئة التنفيذ (مساحة العمل الافتراضية)
مساحة عمل مؤقتة وآمنة، حيث يُنفِّذ الوكيل الإجراءات، ويخزِّن الملفات الوسيطة، وينفِّذ البرامج النصية. هذه المساحة مؤقتة: يُمكن تصدير الملفات عند اكتمال المهمة، وعادةً ما تكون سجلات الجلسة متاحة للتدقيق.
4. طبقة التحكم والسلامة (المحافظ)
قبل اتخاذ أي إجراء ذي عواقب (مثل إرسال نموذج، أو إجراء عملية شراء، أو إرسال بريد إلكتروني)، يطلب الوكيل الإذن من المستخدم أو يؤكده. كما يعرض بثًا مباشرًا للنشاط، مما يتيح للمستخدمين المقاطعة أو التحكم. تُركز OpenAI على تحكم المستخدم باعتباره جوهر التصميم.
القدرات التي تتيحها الهندسة المعمارية
- التصفح المستقل وجمع البيانات: قم بزيارة المواقع، واستخراج البيانات المنظمة، وتلخيص النتائج.
- تعبئة النماذج التفاعلية وإرسالها: أكمل نماذج الويب أو قم بتقديم الطلبات حيثما كان ذلك مسموحًا به.
- معالجة الملفات: فتح وتحرير وإنشاء المستندات والشرائح وجداول البيانات.
- تنفيذ التعليمات البرمجية وتحليل البيانات: تشغيل البرامج النصية لتنظيف البيانات أو تحليلها وإنتاج المخططات/التقارير.
- التكامل: الاتصال بخدمات الطرف الثالث (عندما يُسمح بذلك) للبريد الإلكتروني أو التقويم أو التخزين السحابي أو تدفقات التجارة.
ما هي الميزات والقدرات الرئيسية لـChatGPT Agent؟
الملامح الرئيسية
- تدفقات العمل المستقلة متعددة الخطوات: يمكن للوكلاء التخطيط وتنفيذ تسلسلات من الإجراءات التي تتطلب عادةً خطوات يدوية متعددة.
- التفاعل البصري مع الويب: يستخدم الوكلاء لقطات الشاشة وأتمتة المتصفح للتنقل عبر مواقع الويب والنقر على العناصر وملء النماذج مثلما يفعل الإنسان.
- تنفيذ التعليمات البرمجية وتحليل البيانات: يمكن للوكلاء تشغيل البرامج النصية أو البرامج القصيرة (على سبيل المثال، Python) لتحليل البيانات أو تحويل الملفات أو أتمتة خطوات المعالجة.
- إنشاء المستندات: يمكن للوكلاء إنتاج مخرجات جاهزة للمشاركة - جداول بيانات (Excel)، وعروض شرائح (PowerPoint)، وتقارير، وصور - من الأبحاث الخام أو الملفات التي تم تحميلها.
- الموصلات والمكونات الإضافية: عند الترخيص، يمكن للوكلاء استخدام موصلات لـ Gmail أو Google Drive أو GitHub أو خدمات أخرى لدمج البيانات الخاصة وتنفيذ الإجراءات داخل هذه الخدمات.
- ضوابط الانقطاع والرقابة: يمكنك التدخل أو إيقاف إجراءات الوكيل مؤقتًا أو إلغاؤها؛ كما سيطلب الوكيل أيضًا تأكيدًا للخطوات الحساسة المحتملة.
التوسعات الأخيرة: التجارة الوكيلة والتدفقات المعاملاتية
بدأت OpenAI بدمج أساسيات التجارة الإلكترونية التي تتيح للوكلاء المشاركة في سير عمل التسوق (مثل "الدفع الفوري")، مما يتيح لهم المساعدة في العثور على المنتجات وشرائها نيابةً عن المستخدمين، مع تأكيد الشراء. يُظهر هذا كيف تمتد قدرات الوكلاء بالفعل إلى مجالات المعاملات العملية.
القيود التي يجب أن تكون على علم بها
- قيود صندوق الحماية: نظرًا لأن الوكلاء يعملون في جهاز كمبيوتر افتراضي، فلن يتمكنوا من استخدام جلسات تسجيل الدخول الحالية بشكل موثوق إلا إذا قمت بربطهم صراحةً؛ وقد يؤدي هذا إلى تعقيد بعض المهام (على سبيل المثال، تعديل إدخال CRM خاص).
- الموثوقية والهشاشة: تُظهر المراجعات العملية الأولية أن العميل قد يكون بطيئًا، أو يتعطل في مواقع تفاعلية معقدة، أو يُنتج نتائج "كاملة" فقط داخل بيئة الاختبار الخاصة به دون أن تؤثر على العالم الحقيقي (مثل إضافة عناصر إلى سلة التسوق الافتراضية). توقع صعوبات في النمو.
ما هي فوائد استخدام وكيل ChatGPT؟
لماذا تستخدم وكيلًا بدلاً من الدردشة العادية؟
- يوفر الوقت في المهام متعددة الخطوات. يقوم الوكلاء بأتمتة سير العمل اليدوية المتكررة (البحث → التجميع → التسليم) حتى تتمكن من التركيز على الحكم بدلاً من النقر والتنسيق.
- يقلل الاحتكاك بين التطبيقات. يعمل الوكلاء كالغراء الذي يتنقل بين واجهات المستخدم وواجهات برمجة التطبيقات على الويب، مما يزيل الحاجة إلى نقل البيانات يدويًا.
- إنتاج منتجات متكاملة من البداية إلى النهاية. بدلاً من قائمة التعليمات، يمكنك الحصول على مجموعة شرائح أو جدول بيانات أو تقرير جاهز.
- مقاييس الأتمتة البسيطة. يمكن للفرق إنشاء قوالب للوكلاء للعمل المتكرر (قوائم التحقق من التوجيه، وملخصات البحث الأسبوعية، وسحب البيانات) وإعادة استخدامها بأمان.
فوائد الأعمال والمنتجات
تُظهر التطورات الأخيرة في المنتجات كيفية تطبيق الوكلاء تجاريًا: إذ يتم توسيع نطاق ميزات الوكلاء في OpenAI لتشمل التجارة (على سبيل المثال، تم الإعلان عن ميزة الدفع الفوري داخل ChatGPT في أواخر سبتمبر 2025)، مما يُمكّن الوكلاء ليس فقط من تحديد المنتجات، بل وإتمام عمليات الشراء عند السماح بذلك أيضًا؛ وبالمثل، قدمت مايكروسوفت تكاملات "وضع الوكيل" الخاصة بها في Word/Excel لإنشاء مستندات أو جداول بيانات من خلال المطالبات، مما يُبرز زخمًا متزايدًا بين البائعين نحو الإنتاجية المعتمدة على الوكلاء. تشير هذه التطورات إلى تحول سريع من الدعم السلبي إلى تجارب وكلاء نشطة ومُدرّة للإيرادات.
حالات الاستخدام الشائعة للمبتدئين
ما هي المهام البسيطة التي يمكن للمبتدئين أن يطلبوها من الوكيل؟
- مسح المنافس: "ابحث عن أحدث ثلاث صفحات منتجات لمنافس X وقم بتلخيص تفاصيل السعر والشحن في جدول."
- إعداد الاجتماع: "ابحث في صندوق الوارد الخاص بي (بعد الحصول على الإذن)، وجمع ملاحظات الاجتماع الثلاثة الأخيرة، وقم بإعداد مسودة موجزة من صفحة واحدة."
- تنظيف البيانات: "افتح ملف CSV هذا، وقم بإزالة التكرارات، وتطبيع تنسيقات التاريخ، وإرجاع ملف CSV نظيف."
- انشاء محتوى: "ابحث عن موضوع Y، ثم أنشئ مخططًا مكونًا من 10 شرائح، ثم أنشئ ملاحظات المتحدث."
- الحجز والجدولة: "ابحث عن الرحلات المتاحة في هذه التواريخ واقترح أفضل مسارين."
يجب على المبتدئين البدء بمهام ذات نطاق واضح وأذونات محدودة (على سبيل المثال، منح حق الوصول للقراءة فقط لمجلد واحد) أثناء تعلم سلوك العميل.
مثال على سير العمل للمبتدئين
- حدد الهدف (جملة واحدة).
- منح الحد الأدنى من الوصول (ملف واحد أو موصل).
- اطلب من الوكيل التخطيط - اطلب خطة قصيرة وقائمة بالإجراءات المقترحة.
- الموافقة على الخطة قبل التنفيذ.
- مراجعة النتائج وتكرارها.
وهذا يحافظ على انخفاض المخاطر ويسرع عملية التعلم.
أفضل الممارسات لوضع الوكيل
كيف ينبغي للأفراد والفرق أن يبدأوا بأمان؟
- الامتياز الأقل: امنح فقط الوصول إلى الموصلات والملفات التي يحتاجها الوكيل. تجنب الوصول الشامل إلى البريد الإلكتروني أو الخدمات المصرفية أو محركات الأقراص غير المقيدة.
- اطلب خطة قبل العمل: اطلب من الوكيل أن يوضح الخطوات التي سيتخذها؛ اطلب التأكيد لأي إجراء يكتب أو يرسل البيانات.
- استخدم القوالب: قم بتغليف سير العمل الشائعة كقوالب حتى يكون سلوك العميل قابلاً للتنبؤ والتكرار.
- التدقيق والتسجيل: تمكين سجلات الجلسة والاحتفاظ بنقاط تفتيش بشرية للعمليات الحساسة؛ ويجب على المؤسسات دمج السجلات في عمليات SIEM أو التدقيق الخاصة بها.
- اختبار على البيانات غير الحرجة: قبل الموافقة على الإجراءات المباشرة (المدفوعات والمنشورات العامة)، قم بتشغيل الوكيل على بيانات وهمية أو حساب اختبار.
كيفية تصميم المطالبات لتحقيق النجاح للوكيل
- كن موجهًا نحو الهدف، وليس نحو الوصفات. أخبر الوكيل بالنتيجة التي تريدها والقيود (التنسيق، الموعد النهائي، عدد العناصر).
- اطلب خطة تدريجية أولاً. اطلب من الوكيل إعداد قائمة مرجعية أو "أفكار" حول كيفية المضي قدمًا، ثم الموافقة.
- تحديد النطاق والوقت. بالنسبة للمهام الطويلة، أطلب من الوكيل العمل في دورات قصيرة مع مراجعة بشرية.
تعمل هذه الممارسات على تحسين القدرة على التنبؤ والسلامة.
الأسئلة الشائعة حول وضع الوكيل في ChatGPT
كيف أقوم بتشغيل وضع الوكيل؟
يتوفر وضع الوكيل في ChatGPT كأداة قابلة للتحديد ضمن واجهة الاشتراكات المؤهلة (أطلقت OpenAI هذه الميزة في يوليو 2025، ووسّعت نطاق توفرها عبر باقات الاشتراكات وعروض المؤسسات). قد يختلف التوفر باختلاف الاشتراك والمنطقة؛ يُرجى مراجعة وثائق المنتج أو ملاحظات الإصدار الخاصة بحسابك.
هل يمكن للوكيل الوصول إلى حساباتي الشخصية؟
فقط إذا منحت صراحةً روابط أو بيانات اعتماد. تستخدم تطبيقات الوكلاء الحديثة رموز OAuth أو رموزًا محددة النطاق، وتطلب منك تفويض الوصول إلى خدمات محددة (مثل Gmail وGoogle Drive). تأكد دائمًا من صحة الأذونات قبل الموافقة.
هل وضع الوكيل آمن بدرجة كافية للمهام الحساسة؟
تتضمن الوكلاء ميزات أمان (مثل مطالبات الأذونات، وسجلات الجلسات، والتنفيذ المؤقت). ومع ذلك، ينبغي أن تتضمن المهام الحساسة - كالمعاملات المالية، والملفات القانونية، أو الإجراءات التي قد تُشكل خطرًا على السمعة - موافقات بشرية وحواجز حماية مؤسسية. يعتمد التعامل مع المهام شديدة الحساسية على مدى تحمّلك للمخاطر والضوابط التي يوفرها خطتك أو مورّدك.
ما هي الحدود وأوضاع الفشل؟
قد يُسيء الوكلاء تفسير صفحات الويب، أو يواجهون رموز التحقق (CAPTCHA)، أو يتجاوزون حدود سرعة واجهة برمجة التطبيقات (API)، أو يُنتجون عمليات كشط غير مكتملة. يُفضّل استخدامهم عندما يتمكن شخص من التحقق من صحة النتائج. تُساعد الأدوات (السجلات، عمليات الاختبار) في اكتشاف نقاط الضعف وإصلاحها.
هل يمكنني إنشاء وكيل خاص بي أو دمجه في منتجي؟
نعم. تُقدم OpenAI وغيرها من مُزودي منصات الذكاء الاصطناعي واجهات برمجة تطبيقات للمطورين، ومجموعات تطوير برمجيات (SDKs)، ومجموعات أدوات لبناء الوكلاء، تُقدم أساسيات (النماذج، والأدوات، والحالة، والتنسيق) اللازمة لتصميم وكلاء مُخصصين. تُتيح لك هذه الموارد ضبط سلوك التخطيط، وإضافة أدوات النطاق، وتوصيل الموصلات. راجع أدلة المطورين الرسمية للاطلاع على أمثلة التعليمات البرمجية ومجموعات تطوير البرمجيات (SDKs).
الأفكار النهائية
يمثل وضع الوكيل خطوة تطورية مهمة: من المساعدين المحادثة الذين اقول أنت ماذا تفعل، إلى مساعدي الوكالة الذين do أشياء لك. بالنسبة للمستخدمين العاديين والفرق الصغيرة، يعني ذلك إنشاءً أسرع للمذكرات والتقارير ومسودات المخرجات. أما بالنسبة للشركات، فهو يفتح آفاقًا جديدة (ومخاطر جديدة) للأتمتة، وإنتاج المنتجات، والتجارة (لاحظ ظهور ميزات مثل الدفع الفوري داخل التطبيق والمرتبط بسير عمل الوكلاء). توقع أن تتوسع هذه الإمكانات بسرعة - فالتطورات المتوازية من كبرى شركات المنصات (بما في ذلك تجارب مايكروسوفت "وضع الوكيل" في أوفيس) تشير إلى مشهد قريب تصبح فيه ميزات الوكلاء جزءًا أساسيًا من أدوات الإنتاجية. لكن كن واقعيًا: الوكلاء الأوائل أدوات مساعدة قوية، وليست بدائل مضمونة للحكم البشري.
كيف تبدأ
CometAPI هي منصة واجهات برمجة تطبيقات موحدة تجمع أكثر من 500 نموذج ذكاء اصطناعي من أبرز المزودين، مثل سلسلة ChatGPT، وGemini من Google، وClude من Anthropic، وMidjourney، وSuno، وغيرها، في واجهة واحدة سهلة الاستخدام للمطورين. من خلال توفير مصادقة متسقة، وتنسيق الطلبات، ومعالجة الردود، تُبسط CometAPI بشكل كبير دمج قدرات الذكاء الاصطناعي في تطبيقاتك. سواء كنت تُنشئ روبوتات دردشة، أو مُولّدات صور، أو مُلحّنين موسيقيين، أو خطوط أنابيب تحليلات قائمة على البيانات، تُمكّنك CometAPI من التكرار بشكل أسرع، والتحكم في التكاليف، والاعتماد على مورد واحد فقط، كل ذلك مع الاستفادة من أحدث التطورات في منظومة الذكاء الاصطناعي.
للبدء، استكشف إمكانيات نموذج ChatGPT في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل.
هل أنت مستعد للذهاب؟→ سجل في CometAPI اليوم !
