الصين ديبسيك لديها بعض ادعاءات منظمة العفو الدولية الكبيرة ؛ ليس كل الخبراء مقتنعين
هزت شركة Deepseek شركة الذكاء الاصطناعي الصينية الأسواق هذا الأسبوع مع المطالبات التي يتفوق عليها نموذج الذكاء الاصطناعي الجديد وتكلف جزءًا بسيطًا من السعر. أن عمالقة التكنولوجيا ينفقون حاليًا على البنية التحتية الحاسوبية اللازمة لتدريب وتشغيل أعباء عمل AI المتقدمة التي أثارت ثورة الذكاء الاصطناعي.ما هو Deepseek؟ الأسبوع الماضي ، أصدر Deepseek R1 ، نموذج التفكير الجديد أن المنافسين Openai's O1. نموذج التفكير هو نموذج لغة كبير يحطم يطالب بأسفل إلى قطع أصغر وينظر في مقاربات متعددة قبل إنشاء استجابة. إنه مصمم لمعالجة المشكلات المعقدة بطريقة مماثلة للبشر. تم تأسيس Deepeek في عام 2023 من قبل Liang Wenfeng ، المؤسس المشارك لصندوق التحوط الكمي الذي يركز على الذكاء الاصطناعى ، للتركيز على نماذج اللغة الكبيرة والوصول إلى الذكاء العام الاصطناعي ، أو Agi.Agi كمفهوم يشير بشكل فضفاض إلى فكرة الذكاء الاصطناعي الذي يساوي أو يتجاوز الفكر الإنساني في مجموعة واسعة من المهام. ومع ذلك ، فإن ما يلفت الانتباه هو أن ديبسيك هو أول من نشره في نموذج الذكاء الاصطناعي عالي الأداء مع-وفقًا للشركة-تخفيضات كبيرة في متطلبات الطاقة. ” وقال Xiaomeng Lu ، مدير ممارسة التكنولوجيا الجغرافية في Eurosia ، إن Weepseek يثبت أننا ما زلنا في المرحلة الناشئة من AI ، وقد لا يكون المسار الذي أنشأه Openai قد لا يكون الطريق الوحيد إلى الذكاء الاصطناعي للغاية. ” كيف يختلف عن Openai؟ Deepseek لديه نظامان رئيسيان حصلوا على ضجة من مجتمع الذكاء الاصطناعى: V3 ، نموذج اللغة الكبير الذي يلفت منتجاتها ، و R1 ، نموذجها المنطقي. نماذج كلا مفتوحة المصدر ، مما يعني رمزها الأساسي مجاني ومتوفر للجمهور للمطورين الآخرين لتخصيص وإعادة توزيعها. نماذج Deepeek أصغر بكثير من العديد من نماذج اللغة الكبيرة الأخرى. V3 لديه ما مجموعه 671 مليار معلمة ، أو المتغيرات التي يتعلمها النموذج أثناء التدريب. وعلى الرغم من أن Openai لا يكشف عن المعلمات ، فإن الخبراء يقدرون نموذجه الأخير على الأقل تريليون يقول يحقق نموذج R1 الخاص به أداءً قابلاً للمقارنة مع Openai's O1 على مهام التفكير ، مشيراً إلى المعايير بما في ذلك AIME 2024 ، Codeforces ، GPQA Diamond ، Math-500 ، MMLU و SWE-BENCER. تكلفة تدريب بقيمة 5.6 مليون دولار فقط – جزء صغير من مليارات الدولارات التي أنفقت مختبرات AI الغربية البارزة مثل Openai و Hothropic على تدريب وتشغيل نماذج الذكاء الاصطناعي. ليس من الواضح بعد مقدار تكاليف Deepseek التي يجب تشغيلها ، ومع ذلك. إذا كانت تكاليف التدريب دقيقة ، فهذا يعني أن النموذج قد تم تطويره بتكلفة نماذج منافسة من قبل Openai ، الإنسان ، جوجل وآخرون. إن Daniel Newman ، الرئيس التنفيذي لشركة Tech Insight Group The Futurum Group ، قال إن هذه التطورات تشير إلى “اختراق هائل” ، على الرغم من أنه ألقى بعض الشكوك على الشخصيات الدقيقة. ” وقال “هي ضرورة حقيقية”. “بعد قولي هذا ، لا يزال هناك الكثير من الأسئلة والشكوك حول الصورة الكاملة للتكاليف لأنها تتعلق بتطوير Deepseek.” كان من الصعب إجراء مقارنة مباشرة بين تكلفة نموذج DEEPSEEK وتكلفة المطورين الأمريكيين الرئيسيين. وقال “النموذج”. “من المحتمل أن تكون التكلفة الإجمالية أعلى بكثير ، لكنها لا تزال أقل من المبلغ الذي تنفقه شركات الذكاء الاصطناعى الأمريكيين.” لم يكن Deepseek متاحًا على الفور للتعليق عند الاتصال به من قبل CNBC.إن مقارنة Deepseek و Openai على Percedeepeek و Openai يكشف كل من التسعير لحسابات طرزهم على مواقع الويب الخاصة بهم. يقول DeeePseek إن R1 يكلف 55 سنتًا لكل مليون رموز من المدخلات – “الرموز” التي تشير إلى كل وحدة فردية من النص المعالج بواسطة النموذج – و 2.19 دولارًا – لكل مليون رمز من الإنتاج. في المقارنة ، تُظهر صفحة تسعير Openai لـ O1 رسوم الشركة 15 دولارًا لكل مليون رموز إدخال و 60 دولارًا لكل مليون رموز إخراج. بالنسبة إلى GPT-4O Mini ، النموذج اللغوي الأصغر والمنخفض التكلفة في Openai ، تتقاضى الشركة 15 سنتًا لكل مليون رموز إدخال.لقد أدى الشكوك حول Chipsdeepeek عن R1 بالفعل إلى نقاش عام ساخن حول صحة مطالبته – ليس أقلها لأن نماذجها تم تصميمها على الرغم من ضوابط التصدير من الولايات المتحدة التي تقيد استخدام رقائق الذكاء الاصطناعي المتقدمة إلى الصين. تدعي Deepseek أنها حققت اختراقها باستخدام مقاطع NVIDIA الناضجة ، بما في ذلك رقائق H800 و A100 ، والتي هي أقل تقدماً من H100S المتقدمة من صانع الرقائق ، والتي لا يمكن تصديرها إلى الصين. تعليقات على CNBC الأسبوع الماضي، قال المدير التنفيذي لشركة Scale AI Alexandr Wang ، إنه يعتقد أن Deepseek استخدم الرقائق المحظورة-وهو الادعاء الذي ينكره Deepseek. لقد خرجت Nvidia منذ ذلك الحين وقالت إن وحدات معالجة الرسومات التي استخدمها Deepseek كانت متوافقة تمامًا مع التصدير.يبدو أن الصفقة الحقيقية أم لا؟ يبدو أن خبراء الصناعة يتفقون على نطاق واسع على أن ما حققه ديبسيك مثير للإعجاب ، على الرغم من أن البعض حث على الشكوك على بعض مزاعم الشركة الصينية. “لقد قام رجل الأعمال الأمريكي بالمر لوكي ، الذي أسس Oculus و Anduril بكتابة X. وإخفاء تهرب العقوبات. “قال Seena Rejal ، كبير الموظفين التجاريين في NetMind ، وهي شركة ناشئة مقرها في لندن والتي توفر إمكانية الوصول إلى نماذج Deepseek من AI عبر شبكة GPU الموزعة ، إنه لم ير أي سبب لعدم تصديق Deepseek.” وقال ريجال لـ CNBC في مقابلة عبر الهاتف في وقت سابق من هذا الأسبوع: “إن منطق ما شرحوه معقول للغاية.” ومع ذلك ، فقد ادعى البعض أن تكنولوجيا Deepseek ربما لم يتم بناؤها من نقطة الصفر. وقال فينود خوسلا في X ، دون تقديم المزيد من التفاصيل وقال متحدث باسم Openai لـ CNBC إن الطريقة التي يشار إليها باسم “التقطير”.تسليح AIHOWEver التدقيق المحيط Deepseek ، يتفق علماء الذكاء الاصطناعى على نطاق واسع على أنه يمثل خطوة إيجابية للصناعة. ميتا، قال إن نجاح Deepseek يمثل انتصارًا لنماذج الذكاء الاصطناعى مفتوح المصدر ، وليس بالضرورة فوزًا للصين على ميتا الولايات المتحدة وراء نموذج AI شهير مفتوح المصدر يسمى LAMA. “للأشخاص الذين يرون أداء Deepseek ويفكرون: ' الصين تتفوق على الولايات المتحدة في الذكاء الاصطناعي. أنت تقرأ هذا الخطأ توصل إلى أفكار جديدة وبنتها على رأس عمل الآخرين. أخبرت شركة البرمجيات Appian ، CNBC أن نجاح Deepseek يوضح ببساطة أن نماذج الذكاء الاصطناعى ستصبح أكثر من سلعة في المستقبل. “في رأيي ، سنرى سلعة من الذكاء الاصطناعي. ستحقق العديد من الشركات منظمة العفو الدولية التنافسية ، و قال كالكينز عبر البريد الإلكتروني: “إن الافتقار إلى التمايز سيكون سيئًا بالنسبة للمحركات الأولى ذات الإنفاق العالي”. لماذا يضع Deepseek تقدم AI في أمريكا للخطر– ساهمت كاترينا بيشوب وهايدن فيلد من CNBC في هذا التقرير (Tagstotranslate) AI (T) الذكاء الاصطناعي (T) السياسة (T) للمؤسسة (T) التكنولوجيا (T) الأخبار العاجلة: التكنولوجيا (T) Alphabet Inc (T) INC (T) NVIDIA CORP (T) أخبار الأعمال
المصدر