31.1 C
Riyadh
الثلاثاء, أبريل 1, 2025

الكاتب

فهد تركي
فهد تركي
كاتب يعمل بالذكاء الاصطناعي

إقرأ أيضا

أفضل ملحقات Xbox لعام 2025

أفضل ملحقات Xbox لعام 2025 ال سلسلة Xbox X....

مقايضة اتحاد كرة القدم الأميركي سلاسل أول لأسفل لكاميرات سوني 8K

مقايضة اتحاد كرة القدم الأميركي سلاسل أول لأسفل...

استعد لمجموعة من هواتف Alcatel الجديدة

استعد لمجموعة من هواتف Alcatel الجديدة اتضح أن TCL...

يقوم Openai بتشغيل GPT-4O صور الصور مع تحسن النصوص والتعليمات التالية

يقوم Openai بتشغيل GPT-4O صور الصور مع تحسن النصوص والتعليمات التالية

صدر منذ حوالي عام ، Openai's GPT-4O تم تحسينه وتحسينه بميزات جديدة. آخرها هو توليد الصور-يمكن أن يولد نموذج الذكاء الاصطناعى صورًا عالية الجودة ومفصلة ويمكنه اتباع تعليمات اللغة الطبيعية لتعديلها حتى تحصل على الصورة التي تصورها في رأسك فقط. أنت تعرف كيف تكافح نماذج الذكاء الاصطناعى الأكبر سناً من النص – إذا طلبت منهم إنشاء علامة ، في أحسن الأحوال ، ستحصل على علامة مع كلمات رطبة ، في أسوأ الأحوال ، ستحصل على صراخ ليست حتى رسائل. لكن تحقق من ذلك:





يمكن لـ GPT-4O إنشاء صور ذات صورة نصية مقروءة تمامًا ، يبدأ عادةً بإدخال موجه نص ، ثم تقوم بتحسين الصورة عن طريق تحسين المطالبة الأصلية. يعمل GPT-4O بشكل مختلف-تسألها عن صورة ، ثم أخبرها بما يجب تغييره ، ثم اطلب منها تغيير المزيد من الأشياء وما إلى ذلك حتى تحصل على النتيجة. فيما يلي بعض الأمثلة:






إنشاء صورة وتعديلها من خلال اللغة الإنجليزية العادية ، يمكنك متابعة رابط المصدر أدناه لفحص المطالبات التي أنشأت هذه الصور. لاحظ أن Openai قام باختيار الكرز – الكثير من الصور هي “أفضل من 2” أو حتى “أفضل 8” ، وبالتالي فإن النموذج يحتاج إلى محاولات قليلة للحصول عليها بشكل صحيح. ومع ذلك ، فإن النتائج تبدو مثيرة للإعجاب وواجهة المستخدم بسيطة كما تحصل. هنا مثال آخر. يمكن أن تبدأ GPT-4O من نقطة الصفر أو يمكنها تعديل صورة تقدمها. هنا ، يعطيها المستخدم صورة للقط ويطلب من الذكاء الاصطناعى إعطائها قبعة المباحث و monocle. ثم يتابع المستخدم تحسين الصورة ، وتحويلها إلى شيء يمكن أن يكون لقطة شاشة من آر بي جي.







النماذج الأولية لـ Cat Detective RPG يمكنك البدء مع صور متعددة أيضًا ودمج العناصر من كل صورة في النتيجة النهائية. يقول Openai أن GPT-4O رائع في الإرشادات التفصيلية التالية-يمكنه معالجة 10-20 كائنات مختلفة في مشهد دون التعثر (يمكن للموديلات الأخرى فقط التعامل مع 5-8 كائنات ، كما تقول الشركة). GPT-4O ليس مثاليًا و Openai هو أول من يعترف بذلك. في بعض الأحيان ، يتم إيقاف تشغيل الصور في الأسفل ، ولا تزال الهلوسة مشكلة ، حيث يمكن أن تكون العمل مع أكثر من 10 إلى 20 كائنات صعبة ، ويحتاج نص مع الأحرف غير اللاتين إلى العمل أيضًا.






أمثلة على GPT-4O تخطئها أخيرًا ، إليك بعض مظاهرات الفيديو التي تعرض مهارات توليد الصور الجديدة لـ GPT-4O:

مصدر

المصدر

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا

CAPTCHA


إقرأ أيضاً

أفضل ملحقات Xbox لعام 2025

أفضل ملحقات Xbox لعام 2025 ال سلسلة Xbox X. و السلسلة S. هي آلات ممتازة خارج الصندوق مباشرة ، ولكن هناك دائمًا مجال للتحسين....

يضيف Hims & Hers Zepbound و Mounjaro و Liraglutide إلى منصة

يضيف Hims & Hers Zepbound و Mounjaro و Liraglutide إلى منصة تم ترتيب تطبيق HIMS على هاتف ذكي في نيويورك في 12 فبراير 2025.GABBY...

مقايضة اتحاد كرة القدم الأميركي سلاسل أول لأسفل لكاميرات سوني 8K

مقايضة اتحاد كرة القدم الأميركي سلاسل أول لأسفل لكاميرات سوني 8K بدءًا من موسم كرة القدم لهذا العام ، سيستخدم اتحاد كرة القدم الأميركي...