أخبار العالم

يشرح منشئو الفيديو القصير المدعوم من Sora نقاط القوة والقيود في الفيديو الناتج عن الذكاء الاصطناعي


فاجأت أداة Sora لإنشاء الفيديو من OpenAI مجتمع الذكاء الاصطناعي في فبراير بفيديو سلس وواقعي يبدو متقدمًا بأميال عن المنافسين. لكن العرض الأول الذي تم إدارته بعناية على المسرح أهمل الكثير من التفاصيل – التفاصيل التي تم ملؤها بواسطة مخرج أفلام تم منحه إمكانية الوصول المبكر لإنشاء فيلم قصير باستخدام Sora.

Shy Kids هو فريق إنتاج رقمي مقره في تورنتو، وقد اختارته OpenAI كواحد من القلائل الذين ينتجون أفلامًا قصيرة بشكل أساسي لأغراض OpenAI الترويجية، على الرغم من منحهم قدرًا كبيرًا من الحرية الإبداعية في إنشاء “رأس هوائي”. في مقابلة مع منفذ أخبار المؤثرات البصرية fxguide، وصف فنان ما بعد الإنتاج باتريك سيديربيرج “استخدام Sora فعليًا” كجزء من عمله.

ولعل أهم ما يمكن استنتاجه بالنسبة لمعظم الناس هو ببساطة ما يلي: في حين أن منشور OpenAI الذي يسلط الضوء على الأفلام القصيرة يتيح للقارئ افتراض أنها خرجت بشكل أو بآخر بشكل كامل من Sora، فإن الحقيقة هي أن هذه كانت إنتاجات احترافية، مكتملة بقصص مصورة قوية، وتحرير، وتصحيح ألوان، ونشر أعمال مثل rotoscoping وVFX. تمامًا كما تقول شركة Apple “تم التصوير على iPhone” ولكنها لا تُظهر إعداد الاستوديو والإضاءة الاحترافية وعمل الألوان بعد الواقعة، فإن منشور Sora يتحدث فقط عما تسمح للناس بفعله، وليس كيف فعلوا ذلك بالفعل.

تعتبر مقابلة Cederberg مثيرة للاهتمام وغير فنية تمامًا، لذا إذا كنت مهتمًا على الإطلاق، فتوجه إلى fxguide واقرأها. ولكن إليك بعض المعلومات المثيرة للاهتمام حول استخدام Sora والتي تخبرنا أن النموذج، على الرغم من كونه مثيرًا للإعجاب، ربما يكون أقل قفزة عملاقة إلى الأمام مما كنا نعتقد.

لا يزال التحكم هو الشيء المرغوب فيه والأكثر مراوغة في هذه المرحلة. … أقرب ما يمكن أن نحصل عليه هو المبالغة في الوصف في مطالباتنا. كان شرح خزانة الملابس للشخصيات، بالإضافة إلى نوع البالون، هو طريقنا نحو الاتساق لأنه من لقطة إلى لقطة/من جيل إلى جيل، لا توجد ميزة محددة حتى الآن للتحكم الكامل في الاتساق.

بمعنى آخر، الأمور البسيطة في صناعة الأفلام التقليدية، مثل اختيار لون ملابس الشخصية، تتطلب حلولاً معقدة وفحوصات في نظام توليدي، لأن كل لقطة يتم إنشاؤها بشكل مستقل عن اللقطات الأخرى. من الواضح أن هذا قد يتغير، لكنه بالتأكيد أكثر صعوبة في الوقت الحالي.

كان لا بد من مراقبة مخرجات سورا بحثًا عن العناصر غير المرغوب فيها أيضًا: وصف سيديربيرج كيف سيولد النموذج بشكل روتيني وجهًا على البالون الذي تمتلكه الشخصية الرئيسية كرأس، أو خيط يتدلى من الأمام. كان لا بد من إزالتها لاحقًا، وهي عملية أخرى تستغرق وقتًا طويلاً، إذا لم يتمكنوا من الحصول على المطالبة باستبعادهم.

التوقيت الدقيق وحركات الشخصيات أو الكاميرا غير ممكنة حقًا: “هناك القليل من التحكم الزمني حول مكان حدوث هذه الإجراءات المختلفة في الجيل الفعلي، لكنها ليست دقيقة … إنها نوع من لقطة في الظلام،” سيديربيرج.

على سبيل المثال، يعد توقيت إيماءة مثل الموجة عملية تقريبية للغاية تعتمد على الاقتراحات، على عكس الرسوم المتحركة اليدوية. واللقطة مثل المقلاة لأعلى على جسم الشخصية قد تعكس أو لا تعكس ما يريده المخرج – لذا قام الفريق في هذه الحالة بإخراج لقطة مكونة في اتجاه عمودي وقاموا بقص الصورة في المنشور. غالبًا ما كانت المقاطع التي تم إنشاؤها بالحركة البطيئة دون سبب محدد.

مثال على اللقطة التي خرجت من سورا وكيف انتهت في فترة قصيرة. اعتمادات الصورة: أطفال خجولون

في الواقع، كان استخدام اللغة اليومية لصناعة الأفلام، مثل “التحريك لليمين” أو “اللقطة التتبعية” غير متسق بشكل عام، كما قال سيديربيرج، وهو ما وجده الفريق مفاجئًا للغاية.

وقال: “لم يكن الباحثون، قبل أن يلجأوا إلى الفنانين للعب بهذه الأداة، يفكرون مثل صانعي الأفلام”.

ونتيجة لذلك، قام الفريق بإجراء مئات الأجيال، كل منها من 10 إلى 20 ثانية، وانتهى بهم الأمر باستخدام حفنة قليلة فقط. قدّر سيديربيرغ النسبة بـ 300:1، لكن بالطبع سنفاجأ جميعًا بهذه النسبة في جلسة التصوير العادية.

في الواقع، قام الفريق بعمل مقطع فيديو صغير من وراء الكواليس يشرح فيه بعض المشكلات التي واجهوها، إذا كنت فضوليًا. مثل الكثير من المحتوى المجاور للذكاء الاصطناعي، تنتقد التعليقات إلى حد كبير المسعى برمته – على الرغم من أنها ليست بنفس القدر من الإهانة مثل الإعلان المدعوم بالذكاء الاصطناعي الذي رأيناه يتم الاستهزاء به مؤخرًا.

آخر مشكلة مثيرة للاهتمام تتعلق بحقوق الطبع والنشر: إذا طلبت من Sora أن يعطيك مقطعًا من فيلم “Star Wars”، فسوف يرفض. وإذا حاولت الالتفاف حوله باستخدام “رجل يرتدي ملابس بسيف ليزر على متن سفينة فضائية مستقبلية قديمة”، فسوف يرفض أيضًا، لأنه من خلال بعض الآليات يتعرف على ما تحاول القيام به. كما رفضت أيضًا إجراء “لقطة من نوع أرونوفسكي” أو “تكبير هيتشكوك”.

من ناحية، فمن المنطقي تماما. لكنه يثير السؤال التالي: إذا كان سورا يعرف ما هي هذه العناصر، فهل يعني ذلك أن النموذج قد تم تدريبه على هذا المحتوى، ومن الأفضل أن ندرك أنه ينتهك؟ OpenAI، التي تحافظ على بطاقات بيانات التدريب الخاصة بها قريبة من السترة – إلى حد السخافة، كما هو الحال مع مقابلة CTO ميرا موراتي مع جوانا ستيرن – من المؤكد تقريبًا أنه لن يخبرنا أبدًا.

أما بالنسبة لـ Sora واستخدامه في صناعة الأفلام، فمن الواضح أنها أداة قوية ومفيدة في مكانها، لكن مكانها ليس “إنشاء أفلام من القماش الكامل”. حتى الآن. وكما قال شرير آخر ذات مرة، “سيأتي ذلك لاحقًا”.



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى