أخبار العالم

تتعامل أحبار OpenAI لتدريب الذكاء الاصطناعي على بيانات Reddit


توصلت OpenAI إلى اتفاق مع Reddit لاستخدام بيانات موقع الأخبار الاجتماعية لتدريب نماذج الذكاء الاصطناعي.

وفي منشور مدونة على موقع العلاقات الصحفية الخاص بـ OpenAI، قالت الشركة إن شراكة Reddit ستوفر لها إمكانية الوصول إلى “محتوى منظم وفريد ​​في الوقت الفعلي” – مثل المنشورات والردود – من Reddit، مما يسمح لأدواتها ونماذجها “بفهم أفضل” وعرض” هذا المحتوى. سيتم دمج محتوى Reddit في ChatGPT، الذكاء الاصطناعي للمحادثة الشهير في OpenAI، وستعمل الشركتان معًا لتقديم “ميزات جديدة مدعومة بالذكاء الاصطناعي” غير محددة لكل من مستخدمي Reddit والمشرفين.

ستصبح OpenAI أيضًا شريكًا إعلانيًا لـ Reddit.

كتب OpenAI في المنشور: “سيعتمد Reddit على منصة OpenAI لنماذج الذكاء الاصطناعي لإضفاء الحيوية على رؤيته القوية”. “إن استخدام LLMs وML وAI يسمح لـ Reddit بتحسين تجربة المستخدم للجميع.”

لدى OpenAI العديد من صفقات الترخيص المماثلة مع موفري المحتوى بدءًا من مكتبات الوسائط المالية وحتى ناشري الأخبار. لكن الزاوية غير المعتادة في هذا الأمر هي أن سام ألتمان، الرئيس التنفيذي لشركة OpenAI، يمتلك حصة قدرها 8.7% في Reddit، مما يجعله ثالث أكبر مساهم، وكان ذات يوم عضوًا في مجلس إدارة الشركة.

في محاولة لتثبيط التدقيق، قالت OpenAI في بيانها الصحفي إنه بينما يظل Altman أحد المساهمين في Reddit، فإن الشراكة “كانت بقيادة المدير التنفيذي للعمليات في OpenAI”. [Brad Lightcap]”و” تمت الموافقة عليه من قبل [OpenAI’s] مجلس إدارة مستقل.” (سأشير هنا إلى أن ألتمان نفسه عضو في مجلس إدارة OpenAI.)

جعلت Reddit من اتفاقيات ترخيص البيانات جزءًا أساسيًا بشكل متزايد من استراتيجية النمو الخاصة بها أثناء تنقلها في السوق كشركة عامة.

كشفت Reddit في نشرة الاكتتاب العام أن لديها اتفاقيات تعاقدية لترخيص بياناتها للعملاء بما في ذلك Google بقيمة إجمالية تزيد عن 200 مليون دولار. وفي تقرير أرباحها الأول كشركة عامة، أعلنت ريديت عن زيادة بنسبة 450% على أساس سنوي في الإيرادات غير الإعلانية، وهو ما يعزى في الأساس إلى تلك الاتفاقيات.

ارتفع سهم Reddit بنسبة 11% في تداولات ممتدة بعد الإعلان عن صفقة OpenAI.

قال ستيف هوفمان، الرئيس التنفيذي لشركة Reddit، خلال مكالمة أرباح الشركة في مارس: “المفارقة التي أراها هي أنه مع زيادة المحتوى على الإنترنت الذي تكتبه الآلات، هناك أهمية متزايدة للمحتوى الذي يأتي من أشخاص حقيقيين”. “ولدينا ما يقرب من عقدين من المحادثة الحقيقية.”

تعد منصة Reddit – التي تحتوي على أكثر من مليار مشاركة وأكثر من 16 مليار تعليق، وهي أرقام تنمو كل يوم بفضل مئات الملايين من المستخدمين النشطين – بمثابة منجم ذهب لشركات الذكاء الاصطناعي التوليدي، التي تتعلم نماذجها من أمثلة المحتوى، مثل النص والمحتوى. الصور، لإنشاء محتوى جديد ومماثل.

لكن الشركة قد تواجه معارضة من المستخدمين القلقين بشأن كيفية تحقيق الدخل من بياناتهم.

من المفيد إلقاء نظرة على Stack Overflow، منتدى الأسئلة والأجوبة لمطوري البرامج، والذي وقع مؤخرًا اتفاقية مع OpenAI لتوفير البيانات للتدريب النموذجي للأخير. واحتجاجًا على ذلك، قام بعض المستخدمين بحذف إجاباتهم ذات التصنيف الأعلى على الأسئلة الموجودة في المجتمع. لكن Stack Overflow استعاد المنشورات المحذوفة وحظر هؤلاء المستخدمين، بدعوى أنهم لم يلتزموا بشروط الخدمة الخاصة به.

لقد أعرب Reddit بالفعل عن استيائه من محاولة واحدة لمنح مستخدمي Reddit تحكمًا أكبر في بياناتهم الخاصة.

تحاول Vana، وهي شركة ناشئة مبنية على blockchain، إطلاق بيانات “DAO” (منظمة رقمية مستقلة) للسماح لمستخدمي Reddit بتجميع بياناتهم والسماح لهم باتخاذ القرار معًا حول كيفية استخدام (أو بيع) تلك البيانات المجمعة. قام Reddit بحظر موقع Vana الفرعي المخصص للمناقشة حول DAO، في بيان لـ TechCrunch، واتهم الشركة “باستغلال” ضوابط تصدير البيانات الخاصة بها.


اكتشاف المزيد من موقع خبرة التقني

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع خبرة التقني

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading