أخبار العالم

تنشر Anthropic “مطالبات النظام” التي تجعل كلود مميزًا

نماذج الذكاء الاصطناعي التوليدية ليست في الواقع شبيهة بالبشر. ليس لديهم أي ذكاء أو شخصية، بل مجرد أنظمة إحصائية تتنبأ بالكلمات التالية الأكثر احتمالية في الجملة. ولكن مثل المتدربين في مكان العمل الاستبدادي، فإنهم يفعل اتبع التعليمات دون شكوى – بما في ذلك “مطالبات النظام” الأولية التي تزود النماذج بصفاتها الأساسية، وما ينبغي عليها فعله وما لا ينبغي لها فعله.

يستخدم كل بائعي الذكاء الاصطناعي، من OpenAI إلى Anthropic، مطالبات النظام لمنع (أو على الأقل محاولة منع) النماذج من التصرف بشكل سيئ، وتوجيه النغمة العامة والمشاعر لردود النماذج. على سبيل المثال، قد يخبر الموجه النموذج بأنه يجب أن يكون مهذبًا ولكن لا يعتذر أبدًا، أو أن يكون صادقًا بشأن حقيقة أنه لا يمكنه معرفة كل شيء.

لكن البائعين عادةً ما يحتفظون بمطالبات النظام بالقرب من الصندوق – ربما لأسباب تنافسية، ولكن ربما أيضًا لأن معرفة موجه النظام قد تقترح طرقًا للتحايل عليه. الطريقة الوحيدة لكشف موجه نظام GPT-4o، على سبيل المثال، هي من خلال هجوم الحقن الفوري. وحتى في هذه الحالة، لا يمكن الوثوق بمخرجات النظام بشكل كامل.

ومع ذلك، قامت شركة Anthropic، في إطار جهودها المتواصلة لتصوير نفسها على أنها بائع أكثر أخلاقية وشفافية للذكاء الاصطناعي، بنشر مطالبات النظام لأحدث نماذجها (Claude 3.5 Opus وSonnet وHaiku) في تطبيقات Claude iOS وAndroid وعلى الويب.

قال Alex Albert، رئيس علاقات المطورين في Anthropic، في منشور على X أن Anthropic تخطط لجعل هذا النوع من الكشف أمرًا منتظمًا أثناء قيامها بتحديث وضبط مطالبات نظامها.

لقد أضفنا قسمًا جديدًا لملاحظات إصدار مطالبات النظام إلى مستنداتنا. سنقوم بتسجيل التغييرات التي نجريها على مطالبات النظام الافتراضية على Claude dot ai وتطبيقات الهاتف المحمول الخاصة بنا. (لا يؤثر موجه النظام على واجهة برمجة التطبيقات.) pic.twitter.com/9mBwv2SgB1

– أليكس ألبرت (@ alexalbert__) 26 أغسطس 2024

أحدث المطالبات، بتاريخ 12 يوليو، تحدد بوضوح شديد ما لا تستطيع نماذج كلود فعله – على سبيل المثال، “لا يستطيع كلود فتح عناوين URL، أو الروابط، أو مقاطع الفيديو”. يعد التعرف على الوجه أمرًا محظورًا للغاية؛ يخبر موجه النظام الخاص بـ Claude 3.5 Opus النموذج بأن “يستجيب دائمًا كما لو كان مصابًا بالعمى التام” وأن “يتجنب تحديد أو تسمية أي بشر في [images]”.

لكن المطالبات تصف أيضًا سمات وخصائص شخصية معينة – السمات والخصائص التي قد ترغب نماذج كلود في أن تجسدها الأنثروبيين.

على سبيل المثال، تقول المطالبة الخاصة بـ Opus أن كلود سيظهر كما لو كان “[is] ذكي جدًا وفضولي فكريًا”، و”يستمتع بسماع ما يفكر فيه البشر بشأن قضية ما والمشاركة في مناقشة مجموعة واسعة من المواضيع.” كما يطلب من كلود التعامل مع المواضيع المثيرة للجدل بحياد وموضوعية، وتقديم “أفكار متأنية” و”معلومات واضحة” – وعدم البدء مطلقًا في الرد بكلمات “بالتأكيد” أو “بالتأكيد”.

الأمر كله غريب بعض الشيء بالنسبة لهذا الإنسان، مطالبات النظام هذه، والتي تتم كتابتها مثل ممثل في مسرحية قد يكتب ورقة تحليل الشخصية. تنتهي المطالبة بـ Opus بعبارة “كلود الآن متصل بإنسان”، مما يعطي الانطباع بأن كلود هو نوع من الوعي على الطرف الآخر من الشاشة هدفه الوحيد هو تحقيق أهواء شركائه في المحادثة من البشر.

لكن بالطبع هذا وهم. إذا كانت توجيهات كلود تخبرنا بأي شيء، فهو أنه بدون التوجيه البشري والدعم، فإن هذه النماذج ستكون عبارة عن ألواح فارغة بشكل مخيف.

مع هذه التغييرات السريعة في النظام الجديد – وهي الأولى من نوعها من أحد كبار موردي الذكاء الاصطناعي – تمارس شركة Anthropic ضغوطًا على المنافسين لنشر نفس الشيء. سنرى ما إذا كانت المناورة ناجحة.

مرتبط

الوسوم

تنشر Anthropic “مطالبات النظام” التي تجعل كلود مميزًا

مرتبط

eshrag

اترك تعليقاً إلغاء الرد

يقبل CrowdStrike جائزة “الفشل الأكثر ملحمية” بعد انقطاع تكنولوجيا المعلومات على مستوى العالم

كيفية إعداد اختصارات نصية مخصصة على Android

إن افتقار Yelp للشفافية حول رسوم API يثير غضب المطورين

أغسطس 2024
ن	ث	أرب	خ	ج	س	د
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

مرتبط

eshrag

مقالات ذات صلة

تجمع شركة Doccla الناشئة “المستشفى في المنزل” 46 مليون دولار لتوسعها في أوروبا

شركة Cercli الناشئة لكشوف المرتبات توقع مبلغ 4 ملايين دولار لإنشاء مشروع “Rippling for the Middle East and North Africa”

يأمل مؤسسو BigEndian في استخدام خبرتهم العميقة في مجال الرقائق للمساعدة في تأسيس الهند في مجال أشباه الموصلات

تغلق SparkLabs صندوقًا بقيمة 50 مليون دولار لدعم الشركات الناشئة في مجال الذكاء الاصطناعي

اترك تعليقاً إلغاء الرد

يقبل CrowdStrike جائزة “الفشل الأكثر ملحمية” بعد انقطاع تكنولوجيا المعلومات على مستوى العالم

كيفية إعداد اختصارات نصية مخصصة على Android

إن افتقار Yelp للشفافية حول رسوم API يثير غضب المطورين