تدعي شركة Nvidia أن مولد الصوت الجديد الذي يعمل بتقنية الذكاء الاصطناعي يمكنه إصدار أصوات لم تُسمع من قبل
تقول شركة Nvidia إن محرر الموسيقى الجديد المزود بتقنية الذكاء الاصطناعي يمكنه إنشاء “أصوات لم تُسمع من قبل” – مثل البوق الذي يموء. الأداة تسمى Fugatto، قادر على توليد الموسيقى والأصوات والكلام باستخدام مدخلات النص والصوت التي لم يتم التدريب عليها من قبل. كما هو موضح في هذا الفيديو مضمن أدناه، وهذا يسمح لـ Fugatto بتجميع الأغاني بناءً على المطالبات الجامحة، مثل “إنشاء عواء ساكسفون، ينبح ثم موسيقى إلكترونية مع نباح الكلاب”. تتضمن بعض الأمثلة الأخرى التي تشاركها الشركة القدرة على إنتاج مؤثرات صوتية فريدة بناءً على الوصف، مثل “نبضات صوتية عميقة وهادئة مقترنة بزقزقة رقمية متقطعة وعالية النبرة، مثل صوت استيقاظ آلة واعية ضخمة.” يمكنه أيضًا تحويل صوت شخص ما، أو تغيير لهجته أو إعطائه نبرة مختلفة، مثل الغضب أو الهدوء. هناك طرق لتحرير الموسيقى أيضًا، حيث يستطيع Fugatto عزل الأصوات في الأغنية، وإضافة الآلات، وحتى تغيير اللحن عن طريق تبديل البيانو بمغني الأوبرا. تم إصدار الورق مع الإعلان يظهر قائمة طويلة بجميع مجموعات البيانات التي تقول Nvidia إن Fugatto تم تدريبها عليها، والتي تتضمن إحداها مكتبة من المؤثرات الصوتية من BBC. ولإنشاء Fugatto، تقول Nvidia إنه كان على الباحثين تجميع مجموعة بيانات تحتوي على ملايين العينات الصوتية. ثم قاموا بإنشاء تعليمات “وسعت بشكل كبير نطاق المهام التي يمكن أن يؤديها النموذج، مع تحقيق أداء أكثر دقة وتمكين مهام جديدة دون الحاجة إلى بيانات إضافية”. لا تذكر Nvidia متى – أو ما إذا كانت – ستكون الأداة متاحة على نطاق واسع.
المصدر