يقوم Openai بتشغيل GPT-4O صور الصور مع تحسن النصوص والتعليمات التالية
صدر منذ حوالي عام ، Openai's GPT-4O تم تحسينه وتحسينه بميزات جديدة. آخرها هو توليد الصور-يمكن أن يولد نموذج الذكاء الاصطناعى صورًا عالية الجودة ومفصلة ويمكنه اتباع تعليمات اللغة الطبيعية لتعديلها حتى تحصل على الصورة التي تصورها في رأسك فقط. أنت تعرف كيف تكافح نماذج الذكاء الاصطناعى الأكبر سناً من النص – إذا طلبت منهم إنشاء علامة ، في أحسن الأحوال ، ستحصل على علامة مع كلمات رطبة ، في أسوأ الأحوال ، ستحصل على صراخ ليست حتى رسائل. لكن تحقق من ذلك:
يمكن لـ GPT-4O إنشاء صور ذات صورة نصية مقروءة تمامًا ، يبدأ عادةً بإدخال موجه نص ، ثم تقوم بتحسين الصورة عن طريق تحسين المطالبة الأصلية. يعمل GPT-4O بشكل مختلف-تسألها عن صورة ، ثم أخبرها بما يجب تغييره ، ثم اطلب منها تغيير المزيد من الأشياء وما إلى ذلك حتى تحصل على النتيجة. فيما يلي بعض الأمثلة:
إنشاء صورة وتعديلها من خلال اللغة الإنجليزية العادية ، يمكنك متابعة رابط المصدر أدناه لفحص المطالبات التي أنشأت هذه الصور. لاحظ أن Openai قام باختيار الكرز – الكثير من الصور هي “أفضل من 2” أو حتى “أفضل 8” ، وبالتالي فإن النموذج يحتاج إلى محاولات قليلة للحصول عليها بشكل صحيح. ومع ذلك ، فإن النتائج تبدو مثيرة للإعجاب وواجهة المستخدم بسيطة كما تحصل. هنا مثال آخر. يمكن أن تبدأ GPT-4O من نقطة الصفر أو يمكنها تعديل صورة تقدمها. هنا ، يعطيها المستخدم صورة للقط ويطلب من الذكاء الاصطناعى إعطائها قبعة المباحث و monocle. ثم يتابع المستخدم تحسين الصورة ، وتحويلها إلى شيء يمكن أن يكون لقطة شاشة من آر بي جي.
النماذج الأولية لـ Cat Detective RPG يمكنك البدء مع صور متعددة أيضًا ودمج العناصر من كل صورة في النتيجة النهائية. يقول Openai أن GPT-4O رائع في الإرشادات التفصيلية التالية-يمكنه معالجة 10-20 كائنات مختلفة في مشهد دون التعثر (يمكن للموديلات الأخرى فقط التعامل مع 5-8 كائنات ، كما تقول الشركة). GPT-4O ليس مثاليًا و Openai هو أول من يعترف بذلك. في بعض الأحيان ، يتم إيقاف تشغيل الصور في الأسفل ، ولا تزال الهلوسة مشكلة ، حيث يمكن أن تكون العمل مع أكثر من 10 إلى 20 كائنات صعبة ، ويحتاج نص مع الأحرف غير اللاتين إلى العمل أيضًا.
أمثلة على GPT-4O تخطئها أخيرًا ، إليك بعض مظاهرات الفيديو التي تعرض مهارات توليد الصور الجديدة لـ GPT-4O: