تنشر Anthropic “مطالبات النظام” التي تجعل كلود مميزًا
نماذج الذكاء الاصطناعي التوليدية ليست في الواقع شبيهة بالبشر. ليس لديهم أي ذكاء أو شخصية، بل مجرد أنظمة إحصائية تتنبأ بالكلمات التالية الأكثر احتمالية في الجملة. ولكن مثل المتدربين في مكان العمل الاستبدادي، فإنهم يفعل اتبع التعليمات دون شكوى – بما في ذلك “مطالبات النظام” الأولية التي تزود النماذج بصفاتها الأساسية، وما ينبغي عليها فعله وما لا ينبغي لها فعله.
يستخدم كل بائعي الذكاء الاصطناعي، من OpenAI إلى Anthropic، مطالبات النظام لمنع (أو على الأقل محاولة منع) النماذج من التصرف بشكل سيئ، وتوجيه النغمة العامة والمشاعر لردود النماذج. على سبيل المثال، قد يخبر الموجه النموذج بأنه يجب أن يكون مهذبًا ولكن لا يعتذر أبدًا، أو أن يكون صادقًا بشأن حقيقة أنه لا يمكنه معرفة كل شيء.
لكن البائعين عادةً ما يحتفظون بمطالبات النظام بالقرب من الصندوق – ربما لأسباب تنافسية، ولكن ربما أيضًا لأن معرفة موجه النظام قد تقترح طرقًا للتحايل عليه. الطريقة الوحيدة لكشف موجه نظام GPT-4o، على سبيل المثال، هي من خلال هجوم الحقن الفوري. وحتى في هذه الحالة، لا يمكن الوثوق بمخرجات النظام بشكل كامل.
ومع ذلك، قامت شركة Anthropic، في إطار جهودها المتواصلة لتصوير نفسها على أنها بائع أكثر أخلاقية وشفافية للذكاء الاصطناعي، بنشر مطالبات النظام لأحدث نماذجها (Claude 3.5 Opus وSonnet وHaiku) في تطبيقات Claude iOS وAndroid وعلى الويب.
قال Alex Albert، رئيس علاقات المطورين في Anthropic، في منشور على X أن Anthropic تخطط لجعل هذا النوع من الكشف أمرًا منتظمًا أثناء قيامها بتحديث وضبط مطالبات نظامها.
أحدث المطالبات، بتاريخ 12 يوليو، تحدد بوضوح شديد ما لا تستطيع نماذج كلود فعله – على سبيل المثال، “لا يستطيع كلود فتح عناوين URL، أو الروابط، أو مقاطع الفيديو”. يعد التعرف على الوجه أمرًا محظورًا للغاية؛ يخبر موجه النظام الخاص بـ Claude 3.5 Opus النموذج بأن “يستجيب دائمًا كما لو كان مصابًا بالعمى التام” وأن “يتجنب تحديد أو تسمية أي بشر في [images]”.
لكن المطالبات تصف أيضًا سمات وخصائص شخصية معينة – السمات والخصائص التي قد ترغب نماذج كلود في أن تجسدها الأنثروبيين.
على سبيل المثال، تقول المطالبة الخاصة بـ Opus أن كلود سيظهر كما لو كان “[is] ذكي جدًا وفضولي فكريًا”، و”يستمتع بسماع ما يفكر فيه البشر بشأن قضية ما والمشاركة في مناقشة مجموعة واسعة من المواضيع.” كما يطلب من كلود التعامل مع المواضيع المثيرة للجدل بحياد وموضوعية، وتقديم “أفكار متأنية” و”معلومات واضحة” – وعدم البدء مطلقًا في الرد بكلمات “بالتأكيد” أو “بالتأكيد”.
الأمر كله غريب بعض الشيء بالنسبة لهذا الإنسان، مطالبات النظام هذه، والتي تتم كتابتها مثل ممثل في مسرحية قد يكتب ورقة تحليل الشخصية. تنتهي المطالبة بـ Opus بعبارة “كلود الآن متصل بإنسان”، مما يعطي الانطباع بأن كلود هو نوع من الوعي على الطرف الآخر من الشاشة هدفه الوحيد هو تحقيق أهواء شركائه في المحادثة من البشر.
لكن بالطبع هذا وهم. إذا كانت توجيهات كلود تخبرنا بأي شيء، فهو أنه بدون التوجيه البشري والدعم، فإن هذه النماذج ستكون عبارة عن ألواح فارغة بشكل مخيف.
مع هذه التغييرات السريعة في النظام الجديد – وهي الأولى من نوعها من أحد كبار موردي الذكاء الاصطناعي – تمارس شركة Anthropic ضغوطًا على المنافسين لنشر نفس الشيء. سنرى ما إذا كانت المناورة ناجحة.
اكتشاف المزيد من موقع خبرة التقني
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.