تُعيد الصور المُولّدة بالذكاء الاصطناعي تشكيل الصناعات الإبداعية والصحافة والاتصالات الرقمية. ومع تزايد سهولة الوصول إلى هذه الأدوات، برز ضمان أصالة المحتوى المرئي كاهتمام بالغ. وقد ابتكرت شركة OpenAI، الرائدة في أبحاث الذكاء الاصطناعي وتطبيقاته، استراتيجيات متعددة لاكتشاف الصور المُولّدة باستخدام نماذجها المُولّدة وتصنيفها. تتناول هذه المقالة الآليات التي تستخدمها OpenAI لتحديد الصور المُولّدة بالذكاء الاصطناعي، بالاعتماد على أحدث التطورات في العلامات المائية، ومعايير البيانات الوصفية، ومصدر المحتوى، وأبحاث الكشف الناشئة.
لماذا يجب علينا اكتشاف الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي؟
يُشكّل انتشار مُولّدات الصور المُولّدة بالذكاء الاصطناعي مخاطر تتراوح بين نشر المعلومات المُضلّلة والتزييف العميق، وصولاً إلى التقليد غير المُصرّح به لأعمال الفنانين. يُساعد كشف الصور المُولّدة بالذكاء الاصطناعي المؤسسات الإخبارية على التحقق من المصادر، وحماية حقوق الملكية الفكرية، والحفاظ على ثقة الجمهور في الوسائط الرقمية. إضافةً إلى ذلك، يُمكّن وضع العلامات الواضحة المنصات والمستخدمين من تطبيق سياسات إدارة وبروتوكولات حقوق نشر مناسبة. فبدون أساليب كشف فعّالة، قد تؤثر الصور المُصنّعة على الانتخابات، أو تتلاعب بالرأي العام، أو تنتهك حقوق الطبع والنشر الإبداعية، مع قلة سبل الانتصاف للضحايا.
كيف تقوم OpenAI بتنفيذ الكشف القائم على العلامة المائية؟
بدأت OpenAI باختبار علامات مائية مرئية وغير مرئية خصيصًا للصور المُنشأة عبر مُولّد GPT-4o "متعدد الأنماط". بالنسبة لمستخدمي ChatGPT المجانيين، قد تحمل الصور علامة مائية مرئية خفية - طبقة منقوشة أو علامة زاوية - تُشير إلى أصل الذكاء الاصطناعي. يمكن اكتشاف هذه العلامات المائية برمجيًا عن طريق مسح النمط المُضمّن. في المقابل، غالبًا ما يتلقى المشتركون المدفوعون صورًا خالية من العلامات المائية، ولكنها لا تزال تتضمن توقيعات غير مرئية في بيانات البكسل أو البيانات الوصفية.
تدريب على حقن العلامات المائية وتصنيفها
تتم عملية تضمين العلامة المائية بعد التوليد. أثناء التدريب، تتعلم شبكة التصنيف كيفية التعرف على إشارات العلامة المائية - سواءً كانت تراكبات مرئية أو اضطرابات في سعة البكسل - وتُصنف الصور وفقًا لذلك. من خلال التدريب المشترك لأداة إدراج العلامة المائية وجهاز الكشف، تضمن OpenAI دقة كشف عالية مع الحفاظ على أدنى حد من التشوهات البصرية. تُظهر الاختبارات الأولية معدلات كشف أعلى من 95% للصور ذات العلامة المائية، مع انخفاض شبه تام في النتائج الإيجابية الخاطئة للصور البشرية غير المعدلة.
حدود الأساليب القائمة على العلامة المائية
يمكن إزالة العلامات المائية أو إتلافها من خلال تعديلات بسيطة على الصور، كالقص أو الضغط أو تعديل الألوان. تُظهر الأبحاث أن الاضطرابات المُضادة، التي لا تتجاوز 1% من كثافة البكسل، يمكنها التهرب من كاشفات العلامات المائية دون أي فرق بصري ملحوظ، مما يُبرز المنافسة الشرسة بين مُدافعي العلامات المائية ومُهاجمي التهرب.
كيف تستفيد OpenAI من بيانات C2PA لتحديد المصدر؟
بالإضافة إلى العلامات المائية المرئية، يُضمّن OpenAI بيانات تعريفية للمنشأ متوافقة مع إطار عمل تحالف منشأ المحتوى وأصالته (C2PA). هذه البيانات التعريفية - وهي سجل مُنظّم يتضمن إصدار النموذج، وختم وقت التوليد، ونسب المستخدم - مُوقّعة تشفيريًا لمنع التلاعب بها.
عملية التضمين والتحقق
عند تصدير صورة، تُرفق واجهة برمجة تطبيقات OpenAI بيان C2PA ضمن رأس الملف أو الملف الجانبي. يحتوي هذا البيان على:
- معرّف الطراز (على سبيل المثال،
gpt-4o-image-1) - معلمات التوليد (نص موجه، قيم البذور)
- الطابع الزمني ومعرف المستخدم
- توقيع إلكتروني من المفتاح الخاص لـ OpenAI
تستخدم أدوات التحقق - المدمجة في منصات المحتوى أو المتاحة كأدوات مساعدة مفتوحة المصدر - المفتاح العام لـ OpenAI لتأكيد التوقيع وقراءة البيان. في حال فقدان البيانات الوصفية أو عدم صلاحية التوقيع، قد تُصنف الصورة على أنها غير مُصادق عليها.

المزايا مقارنة بالعلامات المائية المرئية
البيانات الوصفية متينة ضد التلاعبات البسيطة بالصور: عادةً ما يحافظ القص أو تصحيح الألوان على عناوين الملفات. علاوة على ذلك، تُتيح البيانات الوصفية مجموعة بيانات أغنى لتتبع المصدر، حيث يمكن للمنصات تتبع دورة حياة الصورة الكاملة، مع تحديد كلٍّ من الإنشاء والتعديلات اللاحقة. بخلاف العلامات المائية المرئية، تظل البيانات الوصفية غير مرئية للمستخدمين النهائيين، مما يحافظ على جمالية الصورة.
هل يمكن لـ ChatGPT اكتشاف الرسومات التي تم إنشاؤها بواسطة الذكاء الاصطناعي؟
ما مدى الدقة التي يحققها ChatGPT في اكتشاف التحف البصرية الاصطناعية؟
أجرت جامعة بافالو دراسة عام ٢٠٢٤ لتقييم قدرة ChatGPT على اكتشاف الصور المُولّدة بالذكاء الاصطناعي (من نماذج الانتشار الكامن وStyleGAN). باستخدام إرشادات مُصمّمة بعناية، حدّد ChatGPT العيوب التركيبية بدقة ٧٩.٥٪ في الصور المُولّدة بالانتشار و٧٧.٢٪ في مخرجات StyleGAN، وهو أداء يُضاهي أداء أجهزة كشف التزييف العميق المُتخصصة في بداياتها.
كيف ينبغي تصميم المطالبات للكشف الأمثل؟
تقترح أفضل الممارسات تضمين تعليمات واضحة لتحليل الاتساق الهندسي، والإضاءة، وعدم انتظام الملمس. على سبيل المثال:
افحص الصورة بحثًا عن زوايا ظلال غير متسقة، وأنماط نسيج متكررة، وتنعيم غير طبيعي للحواف. حدد ما إذا كانت هذه العلامات تشير إلى أصل نموذج انتشاري.
تساعد هذه الإرشادات الصريحة على توجيه انتباه النموذج نحو الإشارات الجنائية بدلاً من الدلالات السطحية.
هل هناك آليات الكشف السلبي أيضًا؟
في حين أن أنظمة العلامات المائية والبيانات الوصفية الخاصة بـ OpenAI استباقية، فإن الاكتشاف السلبي يحلل القطع الأثرية المتأصلة في الصور التي يولدها الذكاء الاصطناعي - المخالفات الإحصائية في أنماط الضوضاء، أو التناقضات في الملمس، أو بصمات الضغط التي تتركها نماذج الانتشار.
المصنفات القائمة على القطع الأثرية
أظهرت أبحاث مستقلة أن المولدات القائمة على الانتشار تُضفي بصمات دقيقة على نطاق التردد. تستخدم الكواشف السلبية شبكات عصبية ملتوية مُدربة على مجموعات بيانات ضخمة من الصور الحقيقية مقابل صور الذكاء الاصطناعي لرصد هذه العيوب. على الرغم من أن شركة OpenAI لم تُفصّل علنًا أي كاشف سلبي خاص بها، إلا أنها تتعاون مع فرق أكاديمية لتقييم هذه الأساليب لتمييز الصور غير المُعلّمة.
التكامل مع خطوط الأنابيب المعتدلة
يمكن دمج أجهزة الكشف السلبية في سير عمل تعديل المحتوى: تُفحص الصور التي لا تحتوي على بيانات تعريفية C2PA أو علامات مائية مرئية بدقة أكبر بواسطة مُصنِّفات التشويه. يُقلِّل هذا النهج متعدد المستويات الاعتماد على أي طريقة واحدة، ويُخفِّف من أساليب التهرب التي تُزيل العلامات المائية أو تُغيِّرها.
ما هي الضمانات الموجودة لمنع سوء الاستخدام؟
يخضع خط إنتاج الصور في OpenAI لقواعد حماية سياسة المحتوى. وتشمل هذه القواعد:
- تصفية سريعة:حظر طلبات المحتوى غير المسموح به (التزييف العميق للأشخاص الحقيقيين، والأنشطة غير القانونية).
- الفحوصات السياقية:منع إنتاج الصور الضارة أو التي تروج للكراهية.
- إنفاذ العلامة المائية:التأكد من أن جميع الصور المجانية تحمل علامات يمكن اكتشافها.
- تقارير المستخدم:السماح للمنصات بتحديد الصور المشبوهة للمراجعة اليدوية.
وتشكل هذه الضمانات مجتمعة استراتيجية دفاعية متعمقة، تجمع بين الكشف الفني والسياسة والإشراف البشري.
ما هي التحديات التي لا تزال قائمة في مجال الكشف والتحقق؟
وعلى الرغم من هذه التطورات، لا تزال هناك العديد من العقبات:
الإزالة والتهرب العدائي
يمكن للجهات الفاعلة المتطورة استخدام هجمات قائمة على الذكاء الاصطناعي لتشويه أو تجريد العلامات المائية والبيانات الوصفية، أو تطبيق مرشحات معادية تخدع أجهزة الكشف السلبية. هناك حاجة إلى بحث مستمر لتعزيز خوارزميات العلامات المائية وإعادة تدريب المصنفات لمواجهة متجهات الهجوم الجديدة.
التوافق بين الأنظمة الأساسية
لكي تكون بيانات المصدر الوصفية فعّالة، يجب على منظومة واسعة من المنصات - مثل شبكات التواصل الاجتماعي، والمنافذ الإخبارية، ومحرري الرسوم البيانية - اعتماد معايير C2PA واحترام التوقيعات. تشارك OpenAI بنشاط في اتحادات الصناعة لتعزيز التوحيد القياسي، لكن الانتشار العالمي سيستغرق وقتًا.
موازنة الخصوصية والشفافية
يُثير تضمين مطالبات مُفصّلة أو مُعرّفات مستخدم مخاوفَ تتعلق بالخصوصية. يجب على OpenAI تصميم مُخططات بيانات وصفية بعناية للحفاظ على المصدر دون الكشف عن البيانات الشخصية الحساسة.
ما هي الاتجاهات التي ستتخذها جهود الكشف المستقبلية؟
تستكشف OpenAI ومجتمع البحث الأوسع نطاقًا ما يلي:
- العلامات المائية التكيفية:علامات مائية ديناميكية لكل صورة تتغير أنماطها استنادًا إلى المحتوى، مما يجعل إزالتها أكثر تعقيدًا.
- شبكات الكشف الفيدرالية:سجلات مشتركة ومجهولة المصدر لصور الذكاء الاصطناعي المكتشفة لتحسين المصنفات دون الكشف عن البيانات الخاصة.
- أجهزة الكشف القابلة للتفسير:أدوات لا تقوم فقط بتمييز الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي، بل تسلط الضوء أيضًا على المناطق أو الميزات الأكثر دلالة على التوليد، مما يساعد في المراجعة البشرية.
- المنشأ القائم على تقنية البلوكشين:دفاتر حسابات ثابتة تربط البيانات الوصفية بالسجلات الموجودة على السلسلة لتحسين إمكانية التدقيق.
الخاتمة
يُعدّ كشف الصور المُولّدة بالذكاء الاصطناعي تحديًا متطورًا يتطلب مزيجًا من العلامات المائية الاستباقية، ومصادر البيانات الوصفية الدقيقة، والتحليل السلبي للآثار. يُرسي نهج OpenAI متعدد الطبقات - العلامات المائية المرئية للمستخدمين المجانيين، وبيانات C2PA الوصفية لجميع الصور، والتعاون في أبحاث الكشف السلبي - أساسًا متينًا. ومع ذلك، فإنّ لعبة القط والفأر المتمثلة في التهرب من العلامات المائية والهجمات العدائية تعني أن الابتكار المستمر أمرٌ أساسي. من خلال تطوير تكنولوجيا الكشف مع تعزيز معايير الصناعة والمبادئ التوجيهية الأخلاقية، تهدف OpenAI إلى حماية سلامة الوسائط المرئية في عالمٍ يقوده الذكاء الاصطناعي.
كيف تبدأ
يوفر CometAPI واجهة REST موحدة تجمع مئات نماذج الذكاء الاصطناعي، بما في ذلك عائلة ChatGPT، ضمن نقطة نهاية موحدة، مع إدارة مدمجة لمفاتيح واجهة برمجة التطبيقات، وحصص الاستخدام، ولوحات معلومات الفواتير. بدلاً من إدارة عناوين URL وبيانات اعتماد متعددة للموردين.
يمكن للمطورين الوصول واجهة برمجة تطبيقات GPT-image-1 (واجهة برمجة تطبيقات الصور GPT‑4o، اسم الطراز: gpt-image-1) و منتصف الرحلة APIمن خلال كوميت ايه بي اي. للبدء، استكشف قدرات النموذج في ساحة اللعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. يُرجى ملاحظة أن بعض المطورين قد يحتاجون إلى التحقق من مؤسستهم قبل استخدام النموذج.
