لماذا تستخدم شركة Nova AI الناشئة لاختبار التعليمات البرمجية شهادات LLM مفتوحة المصدر أكثر من OpenAI
إنها حقيقة عالمية للطبيعة البشرية أن المطورين الذين يقومون ببناء الكود لا ينبغي أن يكونوا هم من يختبرونه. بادئ ذي بدء، معظمهم يكرهون هذه المهمة إلى حد كبير. ثانيًا، مثل أي بروتوكول تدقيق جيد، لا ينبغي أن يكون أولئك الذين يقومون بالعمل هم الذين يتحققون منه.
ليس من المستغرب إذن أن يكون اختبار التعليمات البرمجية بجميع أشكاله – سهولة الاستخدام، والاختبارات الخاصة باللغة أو المهمة، والاختبار الشامل – محط اهتمام كادر متزايد من الشركات الناشئة في مجال الذكاء الاصطناعي. كل أسبوع، يغطي موقع TechCrunch إعجابًا آخر نقيض (جمع 47 مليون دولار), CodiumAI (جمعت 11 مليون دولار) و QA Wolf (جمعت 20 مليون دولار). ويظهر أشخاص جدد طوال الوقت، مثل خريج Y Combinator الجديد لحظة.
وهناك شركة أخرى هي شركة Nova AI الناشئة منذ عام، وهي خريجة مسرع أكاديمية غير عادية والتي جمعت جولة ما قبل التمويل بقيمة مليون دولار. إنها تحاول التفوق على منافسيها من خلال أدوات الاختبار الشاملة الخاصة بها من خلال كسر العديد من قواعد وادي السيليكون حول كيفية عمل الشركات الناشئة، حسبما قال المؤسس والرئيس التنفيذي زاك سميث لـ TechCrunch.
في حين أن نهج Y Combinator القياسي هو البدء صغيرًا، فإن Nova AI يهدف إلى الوصول إلى المؤسسات المتوسطة والكبيرة ذات قواعد التعليمات البرمجية المعقدة والحاجة الماسة الآن. رفض سميث تسمية أي عملاء يستخدمون منتجه أو يختبرونه باستثناء وصفهم بأنهم في الغالب شركات ناشئة مدعومة بالمشاريع في مرحلة متأخرة (السلسلة C أو ما بعدها) في التجارة الإلكترونية أو التكنولوجيا المالية أو المنتجات الاستهلاكية و”تجارب المستخدم المكثفة”. يعد توقف هذه الميزات مكلفًا.
تقوم تقنية Nova AI بغربلة كود عملائها لإنشاء اختبارات تلقائيًا باستخدام GenAI. إنه موجه بشكل خاص نحو التكامل المستمر وبيئات التسليم/النشر المستمر (CI/CD) حيث يقوم المهندسون باستمرار بشحن الأجزاء والأجزاء إلى كود الإنتاج الخاص بهم.
جاءت فكرة Nova AI من الخبرات التي اكتسبها سميث ومؤسسه المشارك جيفري شيه عندما كانا مهندسين يعملان في شركات التكنولوجيا الكبرى. سميث هو أحد موظفي Google السابقين الذين عملوا في فرق ذات صلة بالسحابة والتي ساعدت العملاء على استخدام الكثير من تقنيات الأتمتة. عمل شيه سابقًا في Meta (أيضًا في Unity وMicrosoft قبل ذلك) مع تخصص نادر في الذكاء الاصطناعي يتضمن البيانات الاصطناعية. لقد أضافوا منذ ذلك الحين مؤسسًا مشاركًا ثالثًا، وهو عالم بيانات الذكاء الاصطناعي هنري لي.
هناك قاعدة أخرى لا تتبعها Nova AI: في حين أن أعداد كبيرة من الشركات الناشئة في مجال الذكاء الاصطناعي تعتمد على GPT الرائدة في الصناعة من OpenAI، فإن Nova AI تستخدم Chat GPT-4 من OpenAI بأقل قدر ممكن. لا يتم تغذية بيانات العملاء إلى OpenAI.
في حين تتعهد شركة OpenAI بعدم استخدام بيانات المشاركين في خطط الأعمال المدفوعة لتدريب نماذجها، فإن الشركات لا تزال لا تثق في OpenAI، كما يخبرنا سميث. وقال سميث: “عندما نتحدث إلى الشركات الكبيرة، يقولون: لا نريد أن تنتقل بياناتنا إلى OpenAI”.
الفرق الهندسية في الشركات الكبرى ليست الوحيدة التي تشعر بهذه الطريقة. OpenAI يدافع من عدد من الدعاوى القضائية من أولئك الذين لا يريدون أن يستخدموا عملهم للتدريب النموذجي، أو يعتقدون أن عملهم انتهى، غير مصرح به وغير مدفوع الأجر، في مخرجاته.
بدلاً من ذلك، تعتمد Nova AI بشكل كبير على نماذج مفتوحة المصدر مثل Llama التي طورتها Meta و ستاركودر (من مجتمع BigCoder، الذي تم تطويره بواسطة ServiceNow وHugging Face)، بالإضافة إلى بناء نماذج خاصة به. ويقول سميث إنهم لم يستخدموا بعد برنامج Gemma من Google مع العملاء، ولكنهم اختبروه و”رأوا نتائج جيدة”.
على سبيل المثال، يوضح أن OpenAI يقدم نماذج لتضمين المتجهات. تعمل عمليات تضمين المتجهات على ترجمة أجزاء من النص إلى أرقام حتى يتمكن LLM من إجراء عمليات متنوعة، مثل تجميعها مع أجزاء أخرى من نص مماثل. لا تستخدم Nova AI تضمينات OpenAI وبدلاً من ذلك تستخدم المصدر المفتوح لهذا على كود المصدر الخاص بالعميل. ويستخدم OpenAI الأدوات فقط لمساعدتها في إنشاء بعض التعليمات البرمجية والقيام ببعض مهام وضع العلامات، وهي كذلك بذل قصارى جهده لعدم إرسال أي بيانات للعملاء إلى OpenAI.
وأوضح سميث: “في هذه الحالة، بدلاً من استخدام نماذج التضمين الخاصة بـ OpenAI، فإننا ننشر نماذج التضمين مفتوحة المصدر الخاصة بنا بحيث عندما نحتاج إلى تشغيل كل ملف، لا نرسله إلى OpenAI فقط”.
في حين أن عدم إرسال بيانات العملاء إلى OpenAI يرضي المؤسسات المتوترة، إلا أن نماذج الذكاء الاصطناعي مفتوحة المصدر هي أيضًا أرخص وأكثر من كافية للقيام بمهام محددة مستهدفة، كما وجد سميث. في هذه الحالة، فإنها تعمل بشكل جيد لكتابة الاختبارات.
وقال: “إن صناعة LLM المفتوحة تثبت حقًا أنها قادرة على التغلب على GPT 4 وموفري النطاقات الكبار هؤلاء، عندما تكون في نطاق ضيق للغاية”. “ليس علينا أن نقدم نموذجًا ضخمًا يمكن أن يخبرك بما تريده جدتك في عيد ميلادها. يمين؟ نحن بحاجة لكتابة الاختبار. وهذا كل شيء. لذلك تم ضبط نماذجنا خصيصًا لهذا الغرض.
كما أن النماذج مفتوحة المصدر تتقدم بسرعة. على سبيل المثال، قدمت Meta مؤخرًا إصدارًا جديدًا من Llama حصل على الأوسمة في دوائر التكنولوجيا وقد يقنع المزيد من الشركات الناشئة في مجال الذكاء الاصطناعي بالنظر إلى بدائل OpenAI.