31.4 C
Riyadh
الأحد, مارس 30, 2025

الكاتب

فهد تركي
فهد تركي
كاتب يعمل بالذكاء الاصطناعي

إقرأ أيضا

Infinix Note 50 Pro 4G Unboxing and Hands On

Infinix Note 50 Pro 4G Unboxing and Hands...

مع الاستوديو والسعي الجانبي ، فإن Apple TV Plus على خط ساخن

مع الاستوديو والسعي الجانبي ، فإن Apple TV...

الصفقات: تصل سلسلة POCO F7 مع معركة Samsung و Google و Vivo

الصفقات: تصل سلسلة POCO F7 مع معركة Samsung...

استطلاع أسبوعي: ما رأيك في Poco F7 Pro و Poco F7 Ultra؟

استطلاع أسبوعي: ما رأيك في Poco F7 Pro...

يقوم Openai بتشغيل GPT-4O صور الصور مع تحسن النصوص والتعليمات التالية

يقوم Openai بتشغيل GPT-4O صور الصور مع تحسن النصوص والتعليمات التالية

صدر منذ حوالي عام ، Openai's GPT-4O تم تحسينه وتحسينه بميزات جديدة. آخرها هو توليد الصور-يمكن أن يولد نموذج الذكاء الاصطناعى صورًا عالية الجودة ومفصلة ويمكنه اتباع تعليمات اللغة الطبيعية لتعديلها حتى تحصل على الصورة التي تصورها في رأسك فقط. أنت تعرف كيف تكافح نماذج الذكاء الاصطناعى الأكبر سناً من النص – إذا طلبت منهم إنشاء علامة ، في أحسن الأحوال ، ستحصل على علامة مع كلمات رطبة ، في أسوأ الأحوال ، ستحصل على صراخ ليست حتى رسائل. لكن تحقق من ذلك:





يمكن لـ GPT-4O إنشاء صور ذات صورة نصية مقروءة تمامًا ، يبدأ عادةً بإدخال موجه نص ، ثم تقوم بتحسين الصورة عن طريق تحسين المطالبة الأصلية. يعمل GPT-4O بشكل مختلف-تسألها عن صورة ، ثم أخبرها بما يجب تغييره ، ثم اطلب منها تغيير المزيد من الأشياء وما إلى ذلك حتى تحصل على النتيجة. فيما يلي بعض الأمثلة:






إنشاء صورة وتعديلها من خلال اللغة الإنجليزية العادية ، يمكنك متابعة رابط المصدر أدناه لفحص المطالبات التي أنشأت هذه الصور. لاحظ أن Openai قام باختيار الكرز – الكثير من الصور هي “أفضل من 2” أو حتى “أفضل 8” ، وبالتالي فإن النموذج يحتاج إلى محاولات قليلة للحصول عليها بشكل صحيح. ومع ذلك ، فإن النتائج تبدو مثيرة للإعجاب وواجهة المستخدم بسيطة كما تحصل. هنا مثال آخر. يمكن أن تبدأ GPT-4O من نقطة الصفر أو يمكنها تعديل صورة تقدمها. هنا ، يعطيها المستخدم صورة للقط ويطلب من الذكاء الاصطناعى إعطائها قبعة المباحث و monocle. ثم يتابع المستخدم تحسين الصورة ، وتحويلها إلى شيء يمكن أن يكون لقطة شاشة من آر بي جي.







النماذج الأولية لـ Cat Detective RPG يمكنك البدء مع صور متعددة أيضًا ودمج العناصر من كل صورة في النتيجة النهائية. يقول Openai أن GPT-4O رائع في الإرشادات التفصيلية التالية-يمكنه معالجة 10-20 كائنات مختلفة في مشهد دون التعثر (يمكن للموديلات الأخرى فقط التعامل مع 5-8 كائنات ، كما تقول الشركة). GPT-4O ليس مثاليًا و Openai هو أول من يعترف بذلك. في بعض الأحيان ، يتم إيقاف تشغيل الصور في الأسفل ، ولا تزال الهلوسة مشكلة ، حيث يمكن أن تكون العمل مع أكثر من 10 إلى 20 كائنات صعبة ، ويحتاج نص مع الأحرف غير اللاتين إلى العمل أيضًا.






أمثلة على GPT-4O تخطئها أخيرًا ، إليك بعض مظاهرات الفيديو التي تعرض مهارات توليد الصور الجديدة لـ GPT-4O:

مصدر

المصدر

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا

CAPTCHA


إقرأ أيضاً

في بيع الحمض النووي ، يتم إنشاء نوع جديد من الذعر في السوق

في بيع الحمض النووي ، يتم إنشاء نوع جديد من الذعر في السوق لافتات في مقر 23andme في سانيفيل ، كاليفورنيا ، الولايات المتحدة...

Infinix Note 50 Pro 4G Unboxing and Hands On

Infinix Note 50 Pro 4G Unboxing and Hands On قمنا بإلغاء ربط Infinix Note 50 Pro+، والآن حان الوقت لنظيره المنخفض قليلاً ، Infinix...

مع الاستوديو والسعي الجانبي ، فإن Apple TV Plus على خط ساخن

مع الاستوديو والسعي الجانبي ، فإن Apple TV Plus على خط ساخن مرحبا الأصدقاء! مرحبًا بكم في المثبت رقم 77 ، دليلك إلى أفضل...