يقوم Google DeepMind بتطوير روبوت تنس الطاولة “للهواة بقوة”.
لقد كانت الرياضة منذ فترة طويلة بمثابة اختبار مهم للروبوتات. قد يكون المثال الأكثر شهرة لهذه الظاهرة هو مسابقة RoboCup لكرة القدم السنوية، والتي يعود تاريخها إلى منتصف التسعينيات. لعبت تنس الطاولة دورًا رئيسيًا في قياس أذرع الروبوتات منذ عقد مضى. تتطلب الرياضة السرعة والاستجابة والاستراتيجية، من بين أمور أخرى.
في ورقة بحثية منشورة حديثًا بعنوان “تحقيق مستوى تنافسي للروبوتات في تنس الطاولة”، يعرض فريق Google DeepMind Robotics أعماله الخاصة في اللعبة. لقد نجح الباحثون في تطوير “لاعب هاوٍ قوي على المستوى البشري” عندما يواجه عنصرًا بشريًا.
أثناء الاختبار، تمكن روبوت تنس الطاولة من التغلب على جميع اللاعبين المبتدئين الذين واجههم. مع اللاعبين المتوسطين، فاز الروبوت بنسبة 55% من المباريات. ومع ذلك، فهو ليس مستعدًا لمواجهة المحترفين. يخسر الروبوت في كل مرة يواجه فيها لاعبًا متقدمًا. أخيرًا، فاز النظام بنسبة 45% من أصل 29 مباراة لعبها.
“هذا هو أول وكيل روبوت قادر على ممارسة رياضة مع البشر على المستوى البشري ويمثل علامة فارقة في تعلم الروبوت والتحكم فيه”، كما تزعم الورقة. “ومع ذلك، فهي أيضًا مجرد خطوة صغيرة نحو هدف طويل الأمد في مجال الروبوتات يتمثل في تحقيق أداء على المستوى البشري في العديد من مهارات العالم الحقيقي المفيدة. ولا يزال هناك الكثير من العمل من أجل تحقيق أداء متسق على المستوى البشري في مهام فردية، ومن ثم أبعد من ذلك، في بناء روبوتات عامة قادرة على أداء العديد من المهام المفيدة، والتفاعل بمهارة وأمان مع البشر في العالم الحقيقي.
أكبر عيب في النظام هو قدرته على الرد على الكرات السريعة. تشير DeepMind إلى أن الأسباب الرئيسية لذلك هي زمن استجابة النظام، وعمليات إعادة التعيين الإلزامية بين اللقطات، ونقص البيانات المفيدة.
“لمعالجة قيود الكمون التي تعيق وقت رد فعل الروبوت للكرات السريعة، نقترح دراسة خوارزميات التحكم المتقدمة وتحسينات الأجهزة”، كما لاحظ الباحثون. “يمكن أن يشمل ذلك استكشاف النماذج التنبؤية لتوقع مسارات الكرة أو تنفيذ بروتوكولات اتصال أسرع بين أجهزة استشعار الروبوت والمحركات.”
المشكلات الأخرى القابلة للاستغلال في النظام هي الكرات العالية والمنخفضة والضربة الخلفية والقدرة على قراءة الدوران على الكرة الواردة.
وفيما يتعلق بكيفية تأثير مثل هذه الأبحاث على الروبوتات بما يتجاوز الفائدة المحدودة للغاية لتنس الطاولة، تستشهد ديب مايند بهندسة السياسات، واستخدامها للمحاكاة للعمل في ألعاب حقيقية، وقدرتها على تكييف استراتيجيتها في الوقت الفعلي.