Openai ترقيات Sora ولفها في ChatGpt

يقوم Openai بدمج إمكانيات توليد الصور في Sora مباشرة في ChatGPT بدءًا من اليوم – هذه الميزة تطلق عليها اسم “الصور في ChatGPT”. بينما كانت سورا سابقًا فقط يمكن الوصول إليه من خلال موقع منفصل، يمكن للمستخدمين الآن استخدامه لإنشاء صور داخل ChatGpt نفسها. تم الإعلان عن Sora كموارد فيديو تعمل بنيو ذكاء العدل ، ولكن هذا الإصدار الأولي يركز فقط على إنشاء الصور وسيكون متاحًا عبر ThatGpt Plus و Pro و Team و Free Conscription Tiers. أخبرت المتحدثة باسم Taya Christianson أن الحد الأقصى لاستخدام الطبقة الحرة هو نفسه Dall-E. لكل chatgpt الأسئلة الشائعة، كان المستخدمون الأحرار قادرين سابقًا على إنشاء “ثلاث صور يوميًا مع Dall · E 3.” أما بالنسبة لمصير دال-إي ، قال كريستيانسون إن “المشجعين” سيستمرون في الوصول عبر GPT مخصص “. “الربط” ، الذي يشير إلى مدى الحفاظ على مولدات الصور منظمة العفو الدولية العلاقات الصحيحة بين السمات والكائنات ؛ على سبيل المثال ، قد يحصل النموذج ذو الربط الفقير ، على موجه لنجم أزرق بالإضافة إلى مثلث أحمر وإنشاء نجمة حمراء ولا مثلث. وقال Goh إن معظم نماذج الصور تكافح مع هذا ، في كثير من الأحيان ، تمزج الألوان والأشكال عندما يُطلب منها تقديم عناصر متعددة – عادة ما يكون حوالي 5 إلى 8. يقول إن توليد الصور الجديد في Sora يمكنه ربط سمات من 15 إلى 20 كائنًا دون تشويش ، مما يمثل تحسنًا كبيرًا في الدقة والموثوقية.مثال على قدرات سورا “الربط”. سوف يلاحظ OpenaiUsers أيضًا تحسنًا في تقديم النص ، مما يسهل إنشاء نص متماسك بدون أخطاء مطبعية على صورة (في الأدوات الحالية ، ستلاحظ هذا النص غالبًا يتم تشويه بسهولة جدا). وقال جوه إن الحصول على نصوص نصية كان تحديًا كبيرًا. إذا كانت الألقاب الصغيرة أو العناصر النصية تحتوي على أخطاء أو أخطاء ، فقد تصبح الصورة بأكملها غير صالحة للاستعمال. “كان هذا تمامًا مثل عملية التكرار التي استغرقت العديد من الأشهر الصحيح”. على الرغم من أنه ليس مثاليًا ، إلا أن الفريق وصل إلى نقطة تكون فيها جودة النص قابلة للاستخدام باستمرار (حيث تميل إلى الخطأ هو نص صغير حقًا). “لقد مر عدة أشهر من التحسينات الصغيرة”. يستخدم النظام نهجًا تلقائيًا-توليد الصور بالتتابع من اليسار إلى اليمين إلى الأسفل ، على غرار كيفية كتابة النص-بدلاً من تقنية نموذج الانتشار المستخدمة من قبل معظم مولدات الصور (مثل Dall-E) التي تنشئ الصورة بأكملها في وقت واحد. يتكهن Goh بأن هذا الاختلاف الفني يمكن أن يكون ما يمنح Sora إمكانيات عرض النص والربط بشكل أفضل.مثال على قدرة سورا على توليد نص متماسك. Openaiin A Brefing قبل إطلاق الميزات ، أظهر الفريق العديد من الأمثلة التي توضح قدرات النظام ، بما في ذلك المخططات العلمية مثل تجربة Prism Newton مع المكونات المسمى بشكل صحيح ، والكوميديا متعددة الألواح مع شخصيات متسقة وفقاعات النص ، والملصقات المعلوماتية مع نص دقيق. كما أبرزوا التطبيقات العملية مثل إنشاء صور خلفية شفافة للملصقات وقوائم المطاعم والشعارات. “إذا ذهبت لرسم صورة ، فأنا أقوم بذلك مع قيود مهارتي الخاصة … ولكن أيضًا مع كل معرفة العالم الذي قمت ببنيه” ، أوضح جاكي شانون في Chatgpt. “إن النموذج يجلب المعرفة العالمية إلى المعادلة ، لذلك عندما تطلب صورة لتجربة Prism من نيوتن ، لا يتعين عليك شرح ما هو هذا لاستعادة الصورة.” يستغرق النظام الجديد وقتًا وقتًا لإنشاء صور من ذي قبل ، على الرغم من أن Openai يشير إلى أن هذه هي مفاضلة جديرة بالاهتمام. وقال شانون: “على الرغم من أن لدينا بالتأكيد مجال لتحسين الكمون … جودة هذه الصور ، والقدرة ، ومعرفة العالم ، تعوض حقًا عن الثواني الإضافية التي سيقضونها في الانتظار”.تم تقديم تجربة نيوتن المنشور على مفكرة في واشنطن سكوير بارك. Openaien سأل عن الضمانات – الإشارة إلى عارية سيئة السمعة من تايلور سويفت تم إنشاؤه باستخدام نموذج Microsoft ، قدرة Grok من Xai على تقديم Kamala Harris بمسدس، و موهبة Google Gemini لإزالة العلامات المائية – أكد فريق Openai على أن النظام يتضمن ضمانات قوية لمنع سوء الاستخدام. وقال شانون إن الأداة تمنع إزالة العلامة المائية ، ويعزف توليد العميق الجنسي ، ويرفض طلبات توليد CSAM. لا يشمل نظام توليد الصور الجديد من Openai علامات المياه المرئية أو المؤشرات التي توضح الصور المولدة من الذكاء الاصطناعي. ومع ذلك ، أوضح شانون أن “جميع الصور التي تم إنشاؤها ستشمل القياسية القياسية C2PA لتمييز الصورة على أنها قد تم إنشاؤها بواسطة Openai “، وسيكون للشركة” بعض الأدوات الداخلية لتكون قادرة على البحث عن الصور أيضًا. “في النهاية ، لا يوجد نظام مثالي لهذا النوع من الأشياء ، لكننا نتحسن باستمرار من ضماناتنا ونفكر في هذا النقطة التي يتم استخدامها من أجل الاستخدام من أجل الاستخدام الخاص بها. كما يريدون “. (tagstotranslate) AI

المصدر

العلامات
OpenAI
Tech

ترك الرد إلغاء الرد

من فضلك ادخل تعليقك

من فضلك ادخل اسمك هنا

لقد أدخلت عنوان بريد إلكتروني غير صحيح!

الرجاء إدخال عنوان بريدك الإلكتروني هنا

CAPTCHA

Please input characters displayed above.

الكاتب

إقرأ أيضا

23andme المؤسس المشارك في الرموز في الرئيس التنفيذي Wojcicki بعد تقديم الإفلاس

لا شيء يعلن عن مشروع طبعة مجتمعية جديدة للهاتف (3A)

الاهتمام مع رقائق Nvidia التي تبلغ 250،000 نفيديا قبل الاكتتاب العام

يغادر فين غوبتا ، كبير المسؤولين الطبيين في صيدلية أمازون ، الشركة

ستعتبر شورتات YouTube طرق العرض حتى لو قمت بالتمرير الماضي

Openai ترقيات Sora ولفها في ChatGpt

ترك الرد إلغاء الرد

إقرأ أيضاً

23andme المؤسس المشارك في الرموز في الرئيس التنفيذي Wojcicki بعد تقديم الإفلاس

لا شيء يعلن عن مشروع طبعة مجتمعية جديدة للهاتف (3A)

الاهتمام مع رقائق Nvidia التي تبلغ 250،000 نفيديا قبل الاكتتاب العام

القائمة

الأكثر شهرة

23andme المؤسس المشارك في الرموز في الرئيس التنفيذي Wojcicki بعد تقديم الإفلاس

لا شيء يعلن عن مشروع طبعة مجتمعية جديدة للهاتف (3A)

أحدث المقالات

23andme المؤسس المشارك في الرموز في الرئيس التنفيذي Wojcicki بعد تقديم الإفلاس

لا شيء يعلن عن مشروع طبعة مجتمعية جديدة للهاتف (3A)