OpenAI تطلق نموذجًا أرخص وأكثر ذكاءً
أطلقت OpenAI نموذجًا أخف وزنًا وأرخص للمطورين للتلاعب به يسمى GPT-4o Mini. تكلفته أقل بكثير من النماذج كاملة الحجم ويقال إنه أكثر قدرة من GPT-3.5. يمكن أن يؤدي إنشاء التطبيقات باستخدام نماذج OpenAI إلى تراكم فاتورة ضخمة. يمكن للمطورين الذين ليس لديهم الوسائل اللازمة للتلاعب بها أن يخرجوا من السعر تمامًا وقد يختارون نماذج أرخص مثل Gemini 1.5 Flash من Google أو Claude 3 Haiku من Anthropic. الآن، تدخل OpenAI لعبة النماذج الخفيفة. قال أوليفييه جودمينت، الذي يقود منتج منصة واجهة برمجة التطبيقات، لصحيفة The Verge: “أعتقد أن GPT-4o Mini يحقق حقًا مهمة OpenAI المتمثلة في جعل الذكاء الاصطناعي متاحًا على نطاق أوسع للناس. إذا أردنا أن يستفيد الذكاء الاصطناعي من كل ركن من أركان العالم، وكل صناعة، وكل تطبيق، فيجب أن نجعل الذكاء الاصطناعي أكثر تكلفة”. بدءًا من اليوم، يمكن لمستخدمي ChatGPT على خطط Free وPlus وTeam استخدام GPT-4o Mini بدلاً من GPT-3.5 Turbo، مع حصول مستخدمي Enterprise على إمكانية الوصول الأسبوع المقبل. هذا يعني أن GPT-3.5 لن يكون خيارًا لمستخدمي ChatGPT بعد الآن، لكنه سيظل متاحًا للمطورين عبر واجهة برمجة التطبيقات إذا فضلوا عدم التبديل إلى GPT-4o Mini. قال جودمينت إن GPT-3.5 سيخرج من واجهة برمجة التطبيقات في مرحلة ما – لكنهم غير متأكدين من متى. قال جودمينت: “أعتقد أنه سيكون شائعًا جدًا”. سيدعم النموذج الجديد خفيف الوزن أيضًا النص والرؤية في واجهة برمجة التطبيقات، وتقول الشركة إنها ستتعامل قريبًا مع جميع المدخلات والمخرجات متعددة الوسائط مثل الفيديو والصوت. مع كل هذه القدرات، قد يبدو هذا وكأنه مساعدون افتراضيون أكثر كفاءة يمكنهم فهم مسار سفرك وإنشاء اقتراحات. ومع ذلك، فإن النموذج مخصص للمهام البسيطة، لذلك لا أحد يبني Siri بثمن بخس. حقق هذا النموذج الجديد درجة 82 بالمائة في قياس فهم اللغة متعدد المهام الضخم (MMLU)، وهو اختبار معياري يتكون من حوالي 16000 سؤال متعدد الخيارات عبر 57 موضوعًا أكاديميًا. عندما تم تقديم MMLU لأول مرة في عام 2020، كانت معظم النماذج سيئة للغاية في ذلك، وكان هذا هو الهدف لأن النماذج أصبحت متقدمة للغاية بالنسبة لامتحانات المعايير السابقة. حصل GPT-3.5 على 70 بالمائة في هذا المعيار، وحصل GPT-4o على 88.7 بالمائة، وتزعم Google أن Gemini Ultra حصل على أعلى نتيجة على الإطلاق 90 بالمائة. وبالمقارنة، فإن النماذج المتنافسة كلود 3 هايكو و الجوزاء 1.5 فلاش وقد سجلت الشركات 75.2% و78.9% على التوالي. ومن الجدير بالذكر أن الباحثين حذرون من الاختبارات المعيارية مثل MMLU، حيث تختلف طريقة إدارتها قليلاً من شركة إلى أخرى. وهذا يجعل من الصعب مقارنة درجات النماذج المختلفة، حيث وذكرت صحيفة نيويورك تايمزهناك أيضًا مشكلة الذكاء الاصطناعي الذي قد يحتوي على هذه الإجابات في مجموعة البيانات الخاصة به، مما يسمح له بالغش بشكل أساسي، وعادةً لا يكون هناك مقيّمون من جهات خارجية جزءًا من العملية. بالنسبة للمطورين الذين يتوقون لبناء تطبيقات الذكاء الاصطناعي بثمن بخس، فإن إطلاق GPT-4o Mini يمنحهم أداة أخرى لإضافتها إلى مخزونهم. سمحت OpenAI لشركة التكنولوجيا المالية الناشئة Ramp باختبار النموذج، باستخدام GPT-4o Mini لبناء أداة تستخرج بيانات النفقات على الإيصالات. لذا، بدلاً من البحث في مربعات النص، يمكن للمستخدم تحميل صورة لإيصاله ويقوم النموذج بفرزها جميعًا لهم. كما قامت Superhuman، عميل البريد الإلكتروني، باختبار GPT-4o Mini واستخدمته لإنشاء ميزة اقتراح تلقائي لاستجابات البريد الإلكتروني. الهدف هو توفير شيء خفيف الوزن وغير مكلف للمطورين لإنشاء جميع التطبيقات والأدوات التي لا يستطيعون تحمل تكلفتها باستخدام نموذج أكبر وأكثر تكلفة مثل GPT-4. سيلجأ العديد من المطورين إلى Claude 3 Haiku أو Gemini 1.5 Flash قبل دفع تكاليف الحوسبة الباهظة المطلوبة لتشغيل أحد أقوى النماذج. إذن، ما الذي استغرق OpenAI كل هذا الوقت؟ قال جودمينت إن ذلك كان “أولوية خالصة” حيث ركزت الشركة على إنشاء نماذج أكبر وأفضل مثل GPT-4، والتي استغرقت الكثير من “الأشخاص وجهود الحوسبة”. ومع مرور الوقت، لاحظت OpenAI اتجاهًا للمطورين الحريصين على استخدام نماذج أصغر، لذلك قررت الشركة الآن أن الوقت قد حان لاستثمار مواردها في بناء GPT-4o Mini. قال جودمينت: “أعتقد أنه سيكون شائعًا للغاية. سواء من خلال التطبيقات الموجودة التي تستخدم كل الذكاء الاصطناعي في OpenAI أو أيضًا العديد من التطبيقات التي تم طرحها من خلال التسعير من قبل”.
المصدر