من Viggle إلى MidJourney، يعد Discord أساسًا غير محتمل لطفرة GenAI
يظهر في الفيديو حشد من الناس يزأرون في مهرجان موسيقي صيفي مكتظ. عندما يبدأ تشغيل الإيقاع عبر مكبرات الصوت، يسير المؤدي أخيرًا على خشبة المسرح: إنه الجوكر. يرتدي الجوكر بدلته الحمراء وشعره الأخضر وطلاء وجهه المميز، ويحرك قبضته ويرقص على المسرح، ويقفز على المدرج ليقترب أكثر من بحر معجبيه. عندما يحين وقت بدء موسيقى الراب، يثني الجوكر ركبتيه ويدفع نفسه عن الأرض، ويقفز لأعلى ولأسفل قبل أن يقوم بدورة 360 درجة على قدم واحدة. يبدو الأمر سهلاً، ومع ذلك إذا حاولت هذه المناورة، فسوف تسقط على وجهك. لم يكن الجوكر بهذه الروعة من قبل.
ثم هناك مقطع فيديو آخر، حيث يخرج جويل إمبييد، نجم الدوري الأمريكي لكرة السلة للمحترفين، من وراء الكواليس لتحية الجمهور قبل أن يؤدي نفس حركات الرقص. ثم إنه نجم “اكبح حماسك” لاري ديفيد. لكن في كل مشهد من هذه المشاهد، يوجد شيء غريب بعض الشيء – سواء كان الجوكر أو جويل إمبييد أو لاري ديفيد، فإن جسد المؤدي مهتز، في حين أن تعابير وجهه لا تتغير أبدًا.
وبطبيعة الحال، كل هذا تم إنشاؤه بواسطة الذكاء الاصطناعي، وذلك بفضل شركة تدعى Viggle.
يُظهر الفيديو الأصلي مغني الراب Lil Yachty وهو يعتلي المسرح في مهرجان Summer Smash في عام 2021 – وفقًا لعنوان مقطع فيديو على YouTube حصد أكثر من 6.5 مليون مشاهدة، فإن هذا الدخول هو “أصعب خروج على الإطلاق”. تحول هذا إلى تنسيق ميمي شائع في أبريل، حيث قام الأشخاص بإدراج المشاهير المفضلين لديهم – أو الأشرار المفضلين لديهم، مثل Sam Bankman-Fried – في فيديو Lil Yachty وهو يعتلي المسرح.
أصبحت عروض الذكاء الاصطناعي لتحويل النص إلى فيديو جيدة بشكل مخيف، لكن لا يمكنك كتابة “sam Bankman-fried as lil yachty at the 2021 Summer Smash” وتتوقع أن يعرف Sora بالضبط ما تعنيه. يعمل Viggle بشكل مختلف.
على خادم Viggle’s Discord، يقوم المستخدمون بتحميل مقطع فيديو لشخص يقوم بنوع من الحركة – غالبًا رقصة TikTok – وصورة لشخص. بعد ذلك، يقوم Viggle بإنشاء مقطع فيديو لذلك الشخص وهو يكرر الحركات من الفيديو. من الواضح أن مقاطع الفيديو هذه ليست حقيقية، على الرغم من أنها لا تزال مسلية. ولكن بعد انتشار ميم Lil Yachty على نطاق واسع، أصبح Viggle ساخنًا، ولم يهدأ الضجيج.
“نحن نركز على بناء ما نسميه نموذج توليد الفيديو الذي يمكن التحكم فيه،” قال مؤسس Viggle Hang Chu لـ TechCrunch. “عندما نقوم بإنشاء محتوى، نريد التحكم بدقة في كيفية تحرك الشخصية، أو كيف يبدو المشهد. لكن الأدوات الحالية تركز فقط على جانب تحويل النص إلى فيديو، حيث لا يكون النص نفسه كافياً لتحديد كل الدقة البصرية.
وفقًا لتشو، لدى Viggle نوعان رئيسيان من المستخدمين – بينما يقوم بعض الأشخاص بإنشاء الميمات، يستخدم البعض الآخر المنتج كأداة في عملية الإنتاج لتصميم الألعاب والمؤثرات البصرية.
قال تشو: “على سبيل المثال، يمكن لفريق من مهندسي الرسوم المتحركة أن يأخذوا بعض التصميمات المفاهيمية ويحولوها بسرعة إلى أصول رسوم متحركة تقريبية ولكن سريعة”. “الغرض كله هو رؤية كيف تبدو وتشعر في المخطط التقريبي للخطة النهائية. عادةً ما يستغرق هذا أيامًا أو حتى أسابيع حتى يتم إعداده يدويًا، ولكن مع Viggle، يمكن القيام بذلك بشكل فوري وتلقائي. وهذا يوفر الكثير من أعمال النمذجة المملة والمتكررة.
في شهر مارس، كان عدد أعضاء Viggle’s Discord بضعة آلاف. بحلول منتصف شهر مايو، كان هناك 1.8 مليون عضو، ومع مرور أيام فقط على شهر يونيو، ارتفع خادم Viggle إلى أكثر من 3 ملايين عضو. وهذا يجعلها أكبر من خوادم الألعاب مثل Valorant وGenshin Impact مجتمعة.
لا يُظهر نمو Viggle أي علامة على التباطؤ، باستثناء أن الطلب المرتفع على إنشاء الفيديو جعل أوقات الانتظار طويلة جدًا بالنسبة للمستخدمين غير الصبر. ولكن نظرًا لأن Viggle تتمحور حول Discord، فقد عمل فريق مطوري Discord مباشرةً مع Viggle لتوجيه الشركة الناشئة البالغة من العمر عامين خلال نموها السريع.
ولحسن حظ Viggle، فقد مر Discord بهذا من قبل. لدى MidJourney، التي تعمل أيضًا على Discord، 20.3 مليون عضو على خادمها، مما يجعلها أكبر مجتمع منفرد على المنصة. بشكل عام، لدى Discord حوالي 200 مليون مستخدم شهريًا.
قال بن شانكين، نائب رئيس المنتج في Discord لـ TechCrunch: “لا أحد مستعد لهذا النوع من النمو، لذا في مرحلة الانتشار تلك، نبدأ العمل معهم، لأنهم غير مستعدين”. “علينا أن نكون مستعدين، لأن جزءًا كبيرًا من الرسائل التي يتم إرسالها الآن هي Viggle وMidJourney، والكثير من الاستهلاك والاستخدام على Discord هو في الواقع الذكاء الاصطناعي التوليدي.”
بالنسبة للشركات الناشئة مثل Viggle وMidJourney، فإن بناء تطبيقاتها على Discord يعني أنها لا تحتاج إلى إنشاء منصة كاملة لمستخدميها – بدلاً من ذلك، تتم استضافتها على منصة لديها بالفعل جمهور ماهر في التكنولوجيا، بالإضافة إلى أدوات الإشراف على المحتوى المضمنة. بالنسبة إلى Viggle، التي تضم خمسة عشر موظفًا فقط، يعد دعم Discord أمرًا بالغ الأهمية.
وقال تشو: “يمكننا التركيز على بناء النموذج كخدمة خلفية، بينما يمكن لـ Discord الاستفادة من بنيتها التحتية في الواجهة الأمامية، ويمكننا في الأساس التكرار بشكل أسرع”.
قبل Viggle، كان تشو باحثًا في مجال الذكاء الاصطناعي في شركة Autodesk، وهي شركة عملاقة للأدوات ثلاثية الأبعاد. كما أجرى أبحاثًا لشركات مثل Facebook وNvidia وGoogle.
بالنسبة إلى Discord، فإن العمل كشركة SaaS عرضية لشركات الذكاء الاصطناعي الناشئة قد يكون له تكلفة. من ناحية، تجلب هذه التطبيقات جمهورًا جديدًا إلى Discord، وربما تكون جيدة لمقاييس المستخدم. لكن استضافة الكثير من مقاطع الفيديو قد تكون صعبة ومكلفة من الناحية التقنية، خاصة عندما يقوم مستخدمون آخرون عبر النظام الأساسي ببث ألعاب الفيديو المباشرة ومحادثات الفيديو والمكالمات الصوتية. بدون منصة مثل Discord، قد لا تتمكن هذه الشركات الناشئة من النمو بنفس المعدل.
وقال شانكين: “ليس من السهل على أي نوع من الشركات التوسع، ولكن Discord مصمم لهذا النوع من النطاق، ونحن قادرون على مساعدتهم على استيعاب ذلك بشكل جيد”.
في حين أن هذه الشركات يمكنها فقط اعتماد إرشادات المحتوى الخاصة بـ Discord واستخدام تطبيقات الإشراف على المحتوى الخاصة بها، إلا أنه سيكون من الصعب دائمًا التأكد من أن 3 ملايين شخص يتصرفون بشكل جيد. حتى تلك الميمات التي تم حذفها من Lil Yachty تنتهك من الناحية الفنية قواعد Viggle، التي تشجع المستخدمين على تجنب إنشاء صور لأشخاص حقيقيين – بما في ذلك المشاهير – دون موافقتهم.
في الوقت الحالي، قد تكون نعمة Viggle هي أن إنتاجها ليس واقعيًا بنسبة 100% حتى الآن. التكنولوجيا مثيرة للإعجاب حقًا، لكننا نعرف ما هو أفضل. من المؤكد أن الرسوم المتحركة الغريبة لـ Joker ليست حقيقية، لكنها مضحكة بالتأكيد.