الذكاء الاصطناعى هو “خنزير الطاقة” ، لكن ديبسيك يمكن أن يغير ذلك
ديبسيك أذهل الجميع في الشهر الماضي مع الادعاء بأن نموذج الذكاء الاصطناعى يستخدم ما يقرب من عُشر مقدار قوة الحوسبة كنموذج LAMA 3.1 من META ، مما يزيد من رؤية عالمية كاملة عن مقدار الطاقة والموارد التي سيتطلبها لتطوير الذكاء الاصطناعي. أخذت بالقيمة الاسمية ، يمكن أن يكون لهذا الادعاء آثار هائلة على التأثير البيئي لمنظمة العفو الدولية. يهرع عمالقة التكنولوجيا لإنشاء مراكز بيانات منظمة العفو الدولية الضخمة ، مع خطط للبعض لاستخدام الكثير من الكهرباء كمدن صغيرة. إن توليد الكثير من الكهرباء يخلق تلوثًا ، مما يثير المخاوف حول كيفية تعرض البنية التحتية الفيزيائية التي تضع أدوات AI الجديدة للتخفيف من تغير المناخ وتفاقم جودة الهواء. إن الحصول على الطاقة التي تتطلبها لتدريب وتشغيل نماذج الذكاء الاصطناعي التوليدي يمكن أن يخفف الكثير من هذا الضغط. لكن لا يزال من السابق لأوانه قياس ما إذا كان Deepseek سيكون مغيرًا للألعاب عندما يتعلق الأمر ببصمة AI البيئية. يعتمد الكثير على كيفية استجابة اللاعبين الرئيسيين الآخرين لاخترافات بدء التشغيل الصيني ، خاصة بالنظر إلى خطط لبناء مراكز بيانات جديدة. يقول “هناك خيار في هذا الأمر”. “إنه يظهر فقط أن الذكاء الاصطناع مادالا سينغ، زميل أبحاث ما بعد الدكتوراه في جامعة كاليفورنيا ، سانتا باربرا الذي يدرس أنظمة الطاقة. “هناك خيار في هذا الأمر”. بدأت الضجة حول Deepseek بإصدار طراز V3 في ديسمبر ، والتي تكلف فقط 5.6 مليون دولار للتشغيل التدريبي النهائي و 2.78 مليون ساعة من GPU للتدريب على رقائق H800 الأقدم في NVIDIA ، وفقًا لـ A التقرير الفني من الشركة. للمقارنة ، استغرق نموذج Meta's Llama 3.1 405b – على الرغم من استخدام رقائق H100 الأحدث والأكثر كفاءة – 30.8 مليون ساعة GPU للتدريب. (لا نعرف التكاليف الدقيقة ، لكن تقديرات Llama 3.1 405b كانت موجودة 60 مليون دولار وبين 100 مليون دولار و 1 مليار دولار بالنسبة للنماذج المماثلة.) ثم أصدرت Deepseek نموذج R1 الخاص بها الأسبوع الماضي ، والذي أطلق عليه الرأسمالي المغامر Marc Andreessen “هدية عميقة للعالم” مساعد الشركة AI بسرعة أطلق النار على القمة من متاجر تطبيقات Apple و Google. وفي يوم الاثنين ، أرسلت أسعار أسهم المنافسين إلى افتراض تمكنت Deepseek من إنشاء بديل لـ Llama و Gemini و ChatGPT لجزء بسيط من الميزانية. شهدت Nvidia ، التي تتيح رقائقها كل هذه التقنيات ، انخفاض سعر سهمها على الأخبار التي لا يحتاج Deepseek's V3 إلا إلى 2000 رقائق للتدريب، مقارنة ب 16000 رقائق أو أكثر من قبل منافسيهايقول .Deepseek إنها كانت قادرة على خفض مقدار الكهرباء التي تستهلكها باستخدام أساليب تدريب أكثر كفاءة. من الناحية الفنية ، يستخدم استراتيجية خالية من الخسارة. يقول سينغ إنه يتلخص في أن تكون أكثر انتقائية مع أي أجزاء من النموذج يتم تدريبها ؛ ليس عليك تدريب النموذج بأكمله في نفس الوقت. إذا كنت تفكر في نموذج الذكاء الاصطناعى كشركة كبيرة لخدمات العملاء مع العديد من الخبراء ، كما يقول سينغ ، إنه أكثر انتقائية في اختيار الخبراء الذين يجب الاستفادة منه. يوفر النموذج أيضًا الطاقة عندما يتعلق الأمر بالاستدلال ، وهو عندما يتم تكليف النموذج فعليًا بفعل شيء ما ، من خلال ما يسمى التخزين المؤقت القيمة الرئيسية والضغط. إذا كنت تكتب قصة تتطلب بحثًا ، فيمكنك التفكير في هذه الطريقة على أنها تشبه القدرة على الرجوع إلى بطاقات الفهرس مع ملخصات عالية المستوى أثناء الكتابة بدلاً من الاضطرار إلى قراءة التقرير بأكمله الذي تم تلخيصه. . مع هذا النهج ، يمكن للباحثين التعلم من بعضهم البعض بشكل أسرع ، ويفتح الباب أمام اللاعبين الأصغر لدخول الصناعة. كما أنه يضع سابقة لمزيد من الشفافية والمساءلة بحيث يمكن للمستثمرين والمستهلكين أن يكونوا أكثر انتقادًا للموارد التي تدخل في تطوير نموذج. يقول سينغ إن هناك سيفًا مزدوجًا للنظر في “إذا أثبتنا أن قدرات الذكاء الاصطناعى المتقدمة لا تتطلب مثل هذا الاستهلاك الهائل للموارد ، فسيتم فتح غرفة تنفس أكثر قليلاً للتخطيط الأكثر استدامة للبنية التحتية”. “يمكن أن يحفز هذا أيضًا مختبرات AI المعروفة اليوم ، مثل Open AI ، الأنثروبور ، Google Gemini ، نحو تطوير خوارزميات وتقنيات أكثر كفاءة وتتجاوز نوعًا من نهج القوة الغاشمة المتمثلة في إضافة المزيد من البيانات وقوة الحوسبة على هذه النماذج.” تأكد من أنه لا يزال هناك شكوك حول ديبسيك. وقال كارلوس توريس دياز ، رئيس أبحاث الطاقة في RYSTAD Energy ، في رسالة بالبريد الإلكتروني: “لقد قمنا ببعض الحفر على Deepseek ، لكن من الصعب العثور على أي حقائق ملموسة حول استهلاك الطاقة للبرنامج”. إذا كان ما تدعيه الشركة حول استخدام الطاقة صحيحًا ، فقد يؤدي ذلك إلى خفض إجمالي استهلاك الطاقة في مركز البيانات ، كما يكتب توريس دياز. وبينما وقعت شركات التكنولوجيا الكبرى على موجة من الصفقات لشراء الطاقة المتجددة ، لا يزال ارتفاع الطلب على الكهرباء من مراكز البيانات يخاطر بتخليص موارد الطاقة الشمسية والرياح المحدودة من شبكات الطاقة. تقليل استهلاك الكهرباء من الذكاء الاصطناعي “سيتيح بدوره المزيد من الطاقة المتجددة للقطاعات الأخرى ، مما يساعد على إزاحة بشكل أسرع من استخدام الوقود الأحفوري” ، وفقًا لما ذكره توريس دياز. “بشكل عام ، يكون الطلب الأقل على الطاقة من أي قطاع مفيدًا لانتقال الطاقة العالمي حيث سيكون هناك حاجة إلى توليد الطاقة الأقل ذوقًا للحفريات على المدى الطويل.” الرئيس التنفيذي لشركة Microsoft Satya Nadella كتب على x عن Jevons Paradox، حيث تصبح التكنولوجيا أكثر كفاءة ، كلما زادت احتمال استخدامها. ينمو الضرر البيئي نتيجة لمكاسب الكفاءة. “السؤال هو ، جي ، إذا تمكنا من إسقاط استخدام الطاقة من الذكاء الاصطناعى بعامل 100 ، فهذا يعني أن هناك 1000 من مزودي البيانات يأتون ويقولون ،” واو ، هذا رائع. سنقوم ببناء وبناء ونبناء 1000 مرة بقدر ما خططنا “؟” يقول فيليب كيرين ، أستاذ أبحاث الهندسة الكهربائية والكمبيوتر بجامعة إلينوي أوربانا شامبين. “سيكون شيء مثير للاهتمام حقًا على مدار السنوات العشر القادمة.” قال توريس دياز أيضًا أن هذه القضية تجعل من المبكر للغاية مراجعة توقعات استهلاك الطاقة “بشكل كبير”. بغض النظر عن مقدار الكهرباء التي يستخدمها مركز البيانات ، من المهم أن ننظر إلى من أين تأتي هذه الكهرباء لفهم مقدار التلوث الذي يخلقه. الصين لا تزال تحصل أكثر من 60 في المائة من الكهرباء من الفحموآخر 3 في المئة يأتي من الغاز. الولايات المتحدة أيضا تدور حول 60 في المائة من الكهرباء من الوقود الأحفوري، لكن غالبية ذلك يأتي من الغاز – الذي يخلق أقل تلوث ثاني أكسيد الكربون عندما تحترق من الفحم. لجعل الأمور أسوأ ، شركات الطاقة تأخير تقاعد محطات توليد الطاقة في الوقود الأحفوري في الولايات المتحدة جزئيًا لتلبية الطلب المرتفع من مراكز البيانات. حتى أن البعض يخطط بناء نباتات الغاز الجديدة. يؤدي حرق المزيد من أنواع الوقود الأحفوري حتماً إلى المزيد من التلوث الذي يسبب تغير المناخ ، وكذلك ملوثات الهواء المحلية التي تثير مخاطر صحية للمجتمعات القريبة. مراكز البيانات أيضا ترفع الكثير من الماء للحفاظ على الأجهزة من ارتفاع درجة الحرارة ، والتي يمكن أن تؤدي إلى مزيد من التوتر في المناطق المعرضة للجفاف. هذه كلها مشكلات يمكن لمطوري الذكاء الاصطناعي التقليل عن طريق الحد من استخدام الطاقة بشكل عام. تمكنت مراكز البيانات التقليدية من القيام بذلك في الماضي. على الرغم من أن أعباء العمل تتضاعف ثلاثة أضعاف ما بين عامي 2015 و 2019 ، تمكنت طلب الطاقة من البقاء ثابتًا نسبيًا خلال تلك الفترة الزمنية ، وفقا لأبحاث جولدمان ساكس. ثم نمت مراكز البيانات أكثر جمالا في عام 2020 مع تقدم في الذكاء الاصطناعي. لقد استهلكوا أكثر من 4 في المائة من الكهرباء في الولايات المتحدة في عام 2023 ، وقد يتراوح ما يقرب من ثلاثة أضعاف إلى حوالي 12 في المائة بحلول عام 2028 ، وفقًا ل تقرير ديسمبر من مختبر لورانس بيركلي الوطني. هناك المزيد من عدم اليقين حول هذه الأنواع من التوقعات الآن ، ولكن استدعاء أي طلقات تعتمد على Deepseek في هذه المرحلة لا يزال هناك لقطة في الظلام. (tagstotranslate) AI
المصدر