تقنيةاخر الاخبار

OpenAI تضع الذكاء الاصطناعي تحت المجهر لمنع الكوارث البيولوجية

نظام مراقبة جديد يرفض 98.7% من الطلبات الخطرة.. خطوة استباقية نحو الأمان الرقمي

في خطوة مهمة نحو تعزيز الأمان الرقمي، أعلنت شركة OpenAI عن إطلاق نظام مراقبة متقدم لمتابعة نماذجها الحديثة للذكاء الاصطناعي، وهما O3 وo4-mini . يأتي هذا النظام في إطار الجهود المستمرة لضمان عدم إساءة استخدام هذه التكنولوجيا في مجالات حساسة مثل التهديدات البيولوجية والكيميائية.

نظام مراقبة استباقي

كشفت OpenAI ، في تقرير السلامة الأخير، عن تطوير ما يُعرف بـ”نظام المراقبة المنطقي”، الذي يعمل على كشف أي محاولات للحصول على إرشادات قد تُستخدم في تنفيذ هجمات بيولوجية أو كيميائية. ويهدف هذا النظام إلى منع الاستجابات التي قد تنتهك السياسات الصارمة للمحتوى، مما يمثل تطوراً لافتاً في مجال الحماية الاستباقية.

وأوضحت الشركة أن النموذجين الجديدين يتمتعان بقدرات أكثر تطوراً مقارنة بالإصدارات السابقة، مما يجعلهما عرضة لاستخدامات محتملة في إنتاج مواد خطرة. ولذلك، تم تطوير آليات مراقبة دقيقة لرصد المحفزات والمضامين المتعلقة بالأسلحة البيولوجية والكيميائية، وضمان رفض أي استجابة مشبوهة.

أداء النظام الجديد

أمضى فريق “القبعة الحمراء” التابع لـOpenAI نحو ألف ساعة في تحليل وتوثيق المحادثات غير الآمنة. وأظهرت النتائج أن النظام الجديد تمكن من رفض 98.7% من الطلبات المصنفة على أنها خطيرة. ومع ذلك، أقرت الشركة بوجود بعض الثغرات المحتملة، خاصةً مع المستخدمين الذين قد يغيرون أساليب طرح الأسئلة للتحايل على آليات الحظر.

الرقابة البشرية لا تزال ضرورية

رغم التقدم التقني، أكدت OpenAI أنها تعتمد جزئياً على الرقابة البشرية لمراجعة التفاعلات وضمان دقة المراقبة. وأشارت إلى أن نماذجها الحالية لا تزال دون مستوى الخطر العالي، لكن القدرات المتزايدة لنموذجي O3 وo4-mini في المجالات الحساسة تجعلهما تحت المراقبة المستمرة، خاصةً عند مقارنتهما بالنماذج السابقة مثل GPT-4 وo1 .

تدابير احترازية إضافية

في إطار تدابيرها الاحترازية، تعتمد الشركة آليات مشابهة لتلك المستخدمة في ضبط محتوى الصور في GPT-4o ، بهدف منع إنشاء محتوى استغلالي أو ضار. ومع ذلك، أعرب بعض الباحثين عن مخاوفهم من أن وتيرة تطوير تقنيات السلامة قد لا تواكب تسارع تطوير النماذج الجديدة.

ويبقى السؤال حول مدى جاهزية النموذج الأخير GPT-4.1 ، الذي أطلقته الشركة مؤخراً، دون تقرير سلامة مصاحب، مما أثار تساؤلات حول مدى التزام الشركة بمعايير الشفافية والأمان.

ضع تعييمك لهذا المقال

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

هذا الموقع يستخدم خدمة أكيسميت للتقليل من البريد المزعجة. اعرف المزيد عن كيفية التعامل مع بيانات التعليقات الخاصة بك processed.

زر الذهاب إلى الأعلى