مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

30 خبر
  • نبض الملاعب
  • هدنة وحصار المضيق
  • إسرائيل تواصل غاراتها على لبنان
  • نبض الملاعب

    نبض الملاعب

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • عيد الأضحى المبارك

    عيد الأضحى المبارك

  • بوتين يصل إلى كازاخستان في زيارة دولة تستمر ثلاثة أيام

    بوتين يصل إلى كازاخستان في زيارة دولة تستمر ثلاثة أيام

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

حقائب "باليستية" تحيط بأحمد الشرع خلال صلاة العيد في حلب (فيديو)

الأمن الفيدرالي الروسي: اغتيال القيادة الإيرانية جرى باستخدام برمجيات خبيثة في أنظمة المراقبة

السفير البريطاني: "نحن من سلم الحكم للشيعة في العراق".. والصدر يرد (فيديو)

الجيش الإسرائيلي يستهدف اجتماعا ضم قادة كبارا في كتائب القسام شمال قطاع غزة

غراهام: انضمام السعودية لاتفاقيات إبراهام سيكون "أكبر تغيير في الشرق الأوسط منذ آلاف السنين"

الحرس الثوري: واشنطن تتوسل الاتفاق وفشلت في حماية حلفائها وبث الفتنة

لبنان لحظة بلحظة.. عمق جديد للحرب الإسرائيلية على لبنان باتجاه الليطاني

إيران توجه تحذيرا لواشنطن بعد الضربة الأخيرة: ردنا سيتجاوز الإقليم

غزة تشيع القيادي في "القسام" محمد عودة .. من هو وما دوره خلال "طوفان الأقصى"؟! (فيديو)

استطلاع: أكثر من نصف الإسرائيليين يعتقدون بخسارة الحرب مع إيران.. قلق من المستقبل مع انهيار الثقة

أردوغان: على يقين بأن نتنياهو سيتلقى الدرس الذي يستحقه أمام مسلمي العالم

"فارس": دوي 3 انفجارات شرق مدينة بندر عباس الإيرانية وتفعيل الدفاعات الجوية

ترامب يخلط بين فنزويلا وإيران أثناء تصريحاته حول الوضع الشرق الأوسط

تقرير أمريكي: حرب إيران استنزفت مخزون واشنطن من الصواريخ المتطورة وفتحت "نافذة ضعف" أمام الصين

معارك ضارية مع الجيش الإسرائيلي في جنوب لبنان و"حزب الله" ينفذ 32 عملية عسكرية نوعية في يوم واحد فقط

هل يتحرر ترامب من "الأوهام الإبراهيمية"؟