تلعب أمازون اللحاق بالركب مع نماذج Nova AI الجديدة لتوليد الأصوات والفيديو
تعرض Amazon تقنية AI الجديدة هذا الأسبوع ، بما في ذلك نموذجها الصوتي الأكثر محادثة للتنافس بشكل أفضل مع أشياء مثل Gemini Live و Openai الصوتي المتقدم وتحديثًا لنموذجها الذي يمكنه إنشاء فيديو. تقول الأمازون. تستخدم Nova Sonic “بنية نموذجية غير محددة” تدعي Amazon أفضل من الأساليب الأخرى التي تربط نماذج منفصلة للتعرف على التعرف على الكلام ، وتحويل الكلام إلى النص ، وتوليد الاستجابة ، ومن ثم النص إلى الأمن. تقول أمازون إن نوفا سونيك يمكنها أيضًا اكتشاف نغمة شخص ما وتقديم المزيد من الاستجابات الطبيعية. إن Nova Sonic متاح لمحاولة من خلال منصة مطور الأساس في Amazon ، وتقول الشركة إنها يمكن استخدامها لجعل أشياء مثل روبوتات خدمة العملاء أو بناء وكلاء الذكاء الاصطناعي للسفر والتعليم والرعاية الصحية ومجموعة متنوعة من الصناعات الأخرى. يتم بالفعل استخدام “مكونات” Nova Sonic في Amazon New Alexa Plus ، و Amazon's Rohit Prasad ، SVP ، ورئيس Agi ، قال TechCrunchكما أعلنت أمازون عن الفيديو نوفا بكرة 1.1، والتي تقول الشركة توفر تحسينات الجودة والكمون أكثر من 1.0. يمكنه الآن أيضًا الحفاظ على أنماط ثابتة عبر مشاهد متعددة مدتها 6 ثوانٍ مقطوعة معًا إلى مقطع فيديو كامل يصل طوله إلى دقيقتين. (tagstotranslate) AI
المصدر