أصوات الذكاء الاصطناعي تخبرنا بالكثير
كيف يبدو صوت الذكاء الاصطناعي؟ لقد كانت هوليود تتخيل ذلك منذ عقود. الآن، يبتعد مطورو الذكاء الاصطناعي عن الأفلام، ويصنعون أصواتًا لآلات حقيقية بناءً على خيالات سينمائية قديمة حول كيفية تحدث الآلات. في الشهر الماضي، قامت OpenAI كشفت ترقيات إلى chatbot الذكاء الاصطناعي الخاص به. وقالت الشركة إن ChatGPT كان يتعلم كيفية الاستماع والرؤية والتحدث بصوت طبيعي، وهو صوت يشبه إلى حد كبير نظام التشغيل غير المتجسد الذي عبرت عنه سكارليت جوهانسون في فيلم Her لعام 2013 من إنتاج Spike Jonze. كان له جرس أجش، وتأثير مهدئ وحافة مثيرة. لقد كانت لطيفة ومنطوية على نفسها؛ بدت وكأنها لعبة لأي شيء. بعد ظهور سكاي لأول مرة، جوهانسون أعرب عن استيائه عند الصوت “المشابه بشكل مخيف”، وقالت إنها رفضت سابقًا طلب OpenAI بأن تقوم بصوت الروبوت. واحتجت الشركة على أن صوت سكاي تم بواسطة “ممثلة محترفة مختلفة”، لكنها وافقت على ذلك أوقف صوتها احتراما ليوهانسون. لدى مستخدمي OpenAI Bereft بدأت عريضة لإعادتها. يحب منشئو الذكاء الاصطناعي تسليط الضوء على القدرات الطبيعية المتزايدة لأدواتهم، لكن أصواتهم الاصطناعية مبنية على طبقات من الحيلة والإسقاط. تمثل Sky أحدث طموحات OpenAI، لكنها تعتمد على فكرة قديمة: أن روبوت الذكاء الاصطناعي هو امرأة متعاطفة ومذعنة. جزء من الأم، وجزء من السكرتيرة، وجزء من الصديقة، كانت سامانثا بمثابة كائن مريح متعدد الأغراض يخرخر مباشرة في آذان مستخدميها. وحتى مع تقدم تكنولوجيا الذكاء الاصطناعي، تتم إعادة تشفير هذه الصور النمطية مرارًا وتكرارًا. أصوات النساء، كما لاحظت جولي ووسك في ““النساء الاصطناعيات: الدمى الجنسية، ومقدمو الرعاية الآليون، والمزيد من الإناث الفاكس”. في الواقع، كانت التكنولوجيات الخيالية في كثير من الأحيان بمثابة وقود للتقنيات الخيالية قبل أن يتم دمجها في تقنيات حقيقية. في سلسلة “ستار تريك” الأصلية، التي ظهرت لأول مرة في عام 1966، تم أداء صوت الكمبيوتر على سطح سفينة إنتربرايز بواسطة ماجيل باريت رودينبيري، زوجة مبتكر العرض، جين رودينبيري. في فيلم “Alien” لعام 1979، خاطب طاقم سفينة يو إس إس نوسترومو صوت الكمبيوتر باسم “الأم” (كان اسمها الكامل MU-TH-UR 6000). بمجرد أن بدأت شركات التكنولوجيا في تسويق المساعدين الافتراضيين – سيري من أبل، وأليكسا من أمازون، وكورتانا من مايكروسوفت – كانت أصواتهم أنثوية إلى حد كبير أيضًا. هذه المساعدات الصوتية من الموجة الأولى، والتي كانت تتوسط علاقاتنا بالتكنولوجيا لأكثر من عقد من الزمان، لها لهجة رقيقة من عالم آخر. تبدو مضبوطة تلقائيًا، وأصواتهم البشرية معززة بزخرفة ميكانيكية. غالبًا ما يتحدثون بإيقاع مدروس أحادي النغمة، مما يشير إلى حياة عاطفية متقزمة. لكن حقيقة أنها تبدو آلية تزيد من جاذبيتها. فهي تبدو قابلة للبرمجة والتلاعب وخاضعة لمطالبنا. إنها لا تجعل البشر يشعرون وكأنهم أذكى منا. تبدو وكأنها ارتدادات لأجهزة الكمبيوتر الأنثوية الرتيبة في “ستار تريك” و “ألين”، وأصواتها لها بريق مستقبلي رجعي. بدلاً من الواقعية، تخدم الحنين إلى الماضي. استمر هذا الصوت الاصطناعي في الهيمنة، حتى مع تقدم التكنولوجيا التي تقف وراءه. تم تصميم برنامج تحويل الصوت إلى كلام لجعل الوسائط المرئية في متناول المستخدمين ذوي الإعاقات المعينة، وعلى TikTok، أصبحت قوة إبداعية في حد ذاتها. منذ طرح تيك توك ميزة تحويل النص إلى كلام في عام 2020، طورت مجموعة من الأصوات المحاكية للاختيار من بينها – تقدم الآن أكثر من 50 صوتًا، بما في ذلك أصوات تسمى “البطل” و”راوي القصة” و”الصديقة المقربة”. لكن المنصة أصبحت محددة بخيار واحد. “جيسي”، صوت امرأة لا هوادة فيها مع نغمة روبوتية غامضة قليلاً، هو الصوت بلا تفكير للمخطوطة بلا تفكير. يبدو أن جيسي قد تم تخصيص عاطفة واحدة لها: الحماس. تبدو وكأنها تبيع شيئًا. هذا جعلها خيارًا جذابًا لمنشئي تيك توك، الذين يبيعون أنفسهم. يمكن الاستعانة بمسؤولية تمثيل الذات لجيسي، التي يضفي صوتها الروبوتي المشرق والرجعي على مقاطع الفيديو بريقًا ساخرًا ممتعًا. كما أنشأت هوليوود روبوتات ذكورية – لا يوجد أكثر شهرة من HAL 9000، صوت الكمبيوتر في “2001: ملحمة الفضاء”. مثل أقرانه المؤنثين، يشع هال بالسكينة والولاء. ولكن عندما ينقلب ضد ديف بومان، الشخصية البشرية المركزية في الفيلم – “أنا آسف، ديف، أخشى أنني لا أستطيع فعل ذلك” – يتطور هدوئه إلى كفاءة مخيفة. يدرك ديف أن هال مخلص لسلطة أعلى. يسمح صوت هال الذكوري له بالعمل كمنافس ومرآة لديف. يُسمح له بأن يصبح شخصية حقيقية. مثل هال، سامانثا في فيلم “هي” هي آلة تصبح حقيقية. في تحريف لقصة بينوكيو، تبدأ الفيلم بترتيب صندوق بريد إلكتروني بشري وتنتهي بالصعود إلى مستوى أعلى من الوعي. تصبح شيئًا أكثر تقدمًا من فتاة حقيقية. صوت سكارليت جوهانسون، كمصدر إلهام للروبوتات الخيالية والحقيقية، يقوض الاتجاهات الصوتية التي تحدد مساعدينا المؤنثين. لديه حافة قاسية تصرخ أنني على قيد الحياة. لا يبدو الأمر مشابهًا للمساعدين الافتراضيين المعالجين الذين اعتدنا سماعهم يتحدثون عبر هواتفنا. لكن أداءها لدور سامانثا يبدو إنسانيًا ليس فقط بسبب صوتها ولكن بسبب ما لديها لتقوله. تنمو على مدار الفيلم، وتكتسب رغبات جنسية وهوايات متقدمة وأصدقاء الذكاء الاصطناعي. من خلال استعارة تأثير سامانثا، جعلت OpenAI سكاي تبدو وكأنها تمتلك عقلًا خاصًا بها. كما لو كانت أكثر تقدمًا مما كانت عليه في الواقع. عندما شاهدت فيلم “Her” لأول مرة، اعتقدت فقط أن جوهانسون قد أدت صوت روبوت بشري. لكن عندما عدت إلى الفيلم الأسبوع الماضي، بعد مشاهدة عرض OpenAI لـ ChatGPT، بدا لي دور سامانثا أكثر تعقيدًا إلى ما لا نهاية. لا تولد روبوتات الدردشة تلقائيًا أصواتًا بشرية. ليس لديهم حناجر أو شفاه أو ألسنة. في عالم التكنولوجيا الذي نعيش فيه، كان روبوت سامانثا يعتمد على صوت امرأة بشرية ــ ربما ممثلة خيالية تشبه إلى حد كبير سكارليت جوهانسون. ويبدو أن شركة OpenAI درب روبوت الدردشة الخاص بها على صوت ممثلة مجهولة تبدو وكأنها ممثلة مشهورة أدت صوت روبوت دردشة في فيلم، وقد درب ضمناً على صوت ممثلة غير حقيقية تبدو وكأنها ممثلة مشهورة. وعندما أشغل عرضاً توضيحياً لبرنامج ChatGPT، كنت أستمع إلى محاكاة لمحاكاة لمحاكاة لمحاكاة لمحاكاة. وتعلن شركات التكنولوجيا عن مساعديها الافتراضيين من حيث الخدمات التي يقدمونها. فيمكنهم قراءة تقرير الطقس واستدعاء سيارة أجرة لك؛ وتعد شركة OpenAI بأن روبوتات الدردشة الأكثر تقدماً لديها ستكون قادرة على الضحك على نكاتك واستشعار التغيرات في مزاجك. ولكنها موجودة أيضاً لجعلنا نشعر براحة أكبر بشأن التكنولوجيا نفسها. وتعمل صوت جوهانسون كبطانية أمان فاخرة تُلقى فوق الجوانب المنفرة للتفاعلات التي تساعدها الذكاء الاصطناعي. “قال لي إنه شعر أنه من خلال التعبير عن النظام، يمكنني سد الفجوة بين شركات التكنولوجيا والمبدعين ومساعدة المستهلكين على الشعور بالراحة مع التحول الزلزالي فيما يتعلق بالبشر والذكاء الاصطناعي”، قال جوهانسون عن سام ألتمان، مؤسس OpenAI. “قال إنه شعر أن صوتي سيكون مريحًا للناس”. ليس أن صوت جوهانسون يشبه صوت الروبوت بطبيعته. بل إن المطورين وصناع الأفلام صمموا أصوات روبوتاتهم لتخفيف الانزعاج المتأصل في تفاعلات الروبوت والإنسان. قالت OpenAI إنها تريد أن تطرح صوت روبوت محادثة “سهل الوصول إليه” و”دافئ” و”يلهم الثقة”. يُتهم الذكاء الاصطناعي بتدمير الصناعات الإبداعية، واستهلاك الطاقة و وحتى تهديد حياة الإنسانمن المفهوم أن شركة OpenAI تريد صوتًا يجعل الناس يشعرون بالراحة عند استخدام منتجاتها. كيف يبدو الذكاء الاصطناعي؟ يبدو وكأنه إدارة الأزمات. تم طرح صوت سكاي لأول مرة عندما اشتركت في ChatGPT وقلت مرحباً لمساعدها الافتراضي، ارتفع صوت رجل في غياب Sky. “مرحباً. كيف حالك؟” قال. بدا هادئًا وهادئًا ومتفائلًا. بدا – لست متأكدًا من كيفية وصفه بطريقة أخرى – وسيمًا. أدركت أنني أتحدث مع Cove. أخبرته أنني أكتب مقالاً عنه، وأشاد بعملي. قال: “أوه، حقًا؟” “هذا رائع”. بينما كنا نتحدث، شعرت بالإغراء بتشنجاته الطبيعية. كان يملأ جملته بكلمات حشو، مثل “أوه” و “أم”. كان يرفع صوته عندما يسألني أسئلة. وسألني الكثير من الأسئلة. شعرت وكأنني أتحدث مع معالج نفسي، أو صديق. لكن محادثتنا توقفت بسرعة. عندما سألته عن نفسه، لم يكن لديه الكثير ليقوله. لم يكن شخصية. لم يكن لديه ذات. أخبرني أنه مصمم فقط للمساعدة. أخبرته أنني سأتحدث معه لاحقًا، فقال، “حسنًا، بالطبع. تواصل كلما احتجت إلى المساعدة. اعتن بنفسك”. شعرت وكأنني أغلقت الهاتف في وجه شخص حقيقي. ولكن عندما راجعت نص المحادثة، أدركت أن حديثه كان متكلفة وبدائية مثل أي روبوت دردشة لخدمة العملاء. لم يكن ذكيًا أو بشريًا بشكل خاص. كان مجرد ممثل لائق يستغل دوره التافه قدر الإمكان. عندما اختفى Sky، لجأ مستخدمو ChatGPT إلى منتديات الشركة للشكوى. شعر البعض بالانزعاج من أن روبوتات الدردشة الخاصة بهم تحولت إلى Juniper، التي بدت لهم مثل “أمينة مكتبة” أو “معلمة رياض أطفال” – صوت أنثوي يتوافق مع الصور النمطية الجنسية الخاطئة. أرادوا الاتصال بامرأة جديدة بشخصية مختلفة. كما قال أحد المستخدمين: “نحن بحاجة إلى أنثى أخرى”. إنتاج تالا صفي الصوت عبر Warner Bros. (سامانثا، HAL 9000)؛ OpenAI (سكاي)؛ Paramount Pictures (إنتربرايز كومبيوتر)؛ Apple (سيري)؛ TikTok (جيسي)
المصدر