قالت شركة ميتا المالكة لفيسبوك إنها ستطلق مجموعة من نماذج الذكاء الاصطناعي الجديدة من قسم الأبحاث لديها، بما في ذلك "المقيم الذي يدرس نفسه ذاتيًا" والذي قد يوفر طريقا نحو مشاركة بشرية أقل في عملية تطوير الذكاء الاصطناعي.
يأتي الإصدار بعد تقديم ميتا للأداة في ورقة بحثية في أغسطس، والتي توضح بالتفصيل كيفية اعتمادها على نفس تقنية "سلسلة التفكير" التي تستخدمها نماذج o1 التي تم إصدارها مؤخرًا من OpenAI لجعلها تصدر أحكامًا موثوقة حول استجابات النماذج.
تتضمن هذه التقنية تقسيم المشكلات المعقدة إلى خطوات منطقية أصغر، ويبدو أنها تعمل على تحسين دقة الإجابات على المشكلات الصعبة في موضوعات مثل العلوم والبرمجة والرياضيات.
استخدم باحثو ميتا البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي بالكامل لتدريب نموذج المقيم، والقضاء على المدخلات البشرية في تلك المرحلة أيضًا.
وقال اثنان من الباحثين في ميتا الذين يقفون وراء المشروع لرويترز إن القدرة على استخدام الذكاء الاصطناعي لتقييم الذكاء الاصطناعي بشكل موثوق تقدم لمحة عن مسار محتمل نحو بناء عملاء ذكاء اصطناعي مستقلين يمكنهم التعلم من أخطائهم.
يتصور الكثيرون في مجال الذكاء الاصطناعي أن هؤلاء الوكلاء هم مساعدون رقميون يتمتعون بالذكاء الكافي لتنفيذ مجموعة واسعة من المهام دون تدخل بشري.
يمكن لنماذج التحسين الذاتي أن تلغي الحاجة إلى عملية مكلفة وغير فعالة في كثير من الأحيان تُستخدم اليوم تسمى "التعلم المعزز من ردود الفعل البشرية"، والتي تتطلب مدخلات من المعلقين البشريين الذين يجب أن يكون لديهم خبرة متخصصة لتسمية البيانات بدقة والتحقق من الإجابات على الاستفسارات الرياضية والكتابة المعقدة. صحيحة.
وقال جيسون ويستون، أحد الباحثين: "نأمل، مع تحول الذكاء الاصطناعي أكثر فأكثر إلى إنسان خارق، أن يتحسن في التحقق من عمله، بحيث يصبح في الواقع أفضل من الإنسان العادي".
وقال: "إن فكرة التعلم الذاتي والقدرة على التقييم الذاتي أمر بالغ الأهمية لفكرة الوصول إلى هذا النوع من المستوى البشري الفائق للذكاء الاصطناعي".
كما نشرت شركات أخرى، بما في ذلك Google وAnthropic، بحثًا حول مفهوم RLAIF، أو التعلم المعزز من تعليقات الذكاء الاصطناعي. على عكس ميتا، تميل هذه الشركات إلى عدم إطلاق نماذجها للاستخدام العام.
تضمنت أدوات الذكاء الاصطناعي الأخرى التي أصدرتها شركة Meta يوم الجمعة تحديثًا لنموذج تعريف الصورة Segment Anything الخاص بالشركة، وهي أداة تعمل على تسريع أوقات إنشاء استجابة LLM ومجموعات البيانات التي يمكن استخدامها للمساعدة في اكتشاف مواد غير عضوية جديدة.
تم أضافة تعليقك سوف يظهر بعد المراجعة