أحدث صدمة في "وادي السيليكون".. رحلة DeepSeek من نموذج ناشئ إلى تهديد عمالقة الـ AI

نشرالاثنين، 27 يناير 2025 | 3:45 مساءً
آخر تحديث الثلاثاء، 28 يناير 2025 | 11:30 صباحًا

استمع للمقال
Play

نموذج ذكاء اصطناعي لشركة صينية ناشئة يُحدث صدمة في وادي السيلكون، ويثير مخاوف الأسواق بشأن انفجار فقاعة الـ AI.. ما هو DeepSeek، ولماذا يثير كل ذلك الزخم؟

الشركة غير المعروفة نسبياً على نطاق واسع مقارنة بنظيراتها من الشركات الأميركية العاملة بالقطاع، والتي تأسست في مايو/ آيار من العام 2023، وأطلقت أخيراً نماذج ذكاء اصطناعي متطورة بكفاءة عالية وتكلفة محدودة مقارنة بالاستثمارات التي تضخها الشركات الأميركية الأخرى، مع تقديم تلك النماذج كموارد مفتوحة المصدر.

تتحدى نماذج الشركة -التي تأسست على يد ليانغ وينفينغ، وهو مستثمر بارز في صناعتي صناديق التحوط والـ AI، وتعمل بشكل مستقل لكنها ممولة من قبل صندوق وينفينغ High-Flyer -  لاعبين رئيسيين وعلى رأسهم OpenAI  و Google وMeta.

نموذج التمويل المذكور يصفه تقرير لـ "فوربس" بأنه سمح للشركة بملاحقة مشاريع الذكاء الاصطناعي الطموحة دون ضغوط المستثمرين الخارجيين"، الأمر الذي مكنهم من إعطاء الأولوية للبحث والتطوير على المدى الطويل.

أما فريق الشركة، فيتألف في الأساس من مجموعة من الموهوبين من الخريجين الشباب في جامعات صينية، حيث تعطي ممارسات التوظيف في الشركة الأولوية للقدرات الفنية على الخبرة العملية التقليدية.

بداية الرحلة

بدأت رحلة DeepSeek بإصدار DeepSeek Coder بعد أشهر قليلة من تأسيسها، وتحديداً في شهر نوفمبر/ تشرين الثاني من العام 2023، وهو نموذج مفتوح المصدر مصمم لمهام الترميز.

ثم بعد ذلك أطلقت الشركة نموذجها DeepSeek LLM، وهو نموذج يستهدف التنافس مع نماذج اللغات الكبيرة الأخرى.

وفي مايو/ آيار من العام الماضي أطلقت الشركة نموذجها DeepSeek-V2 ، والذي اكتسب اهتماماً واسعاً بأدائه القوي وتكلفته المنخفضة، الأمر الذي أدى إلى حرب أسعار في سوق نماذج الـ AI الصينية، الأمر الذي دفع شركات مثل ByteDance وTencent وBaidu وAlibaba، إلى خفض أسعار نماذج الذكاء الاصطناعي الخاصة بها لتظل قادرة على المنافسة.


اقرأ أيضاً: تطبيق الذكاء الاصطناعي الصيني DeepSeek يتسبب في موجة بيعية بالأسواق الأميركية

لاحقاً تم استبدال DeepSeek-V2 بـ DeepSeek-Coder-V2 ، وهو نموذج أكثر تقدماً يحتوي على 236 مليار متغير. وقد تم تصميمه لمهام وتحديات الترميز المعقدة، ويتميز بطول سياق مرتفع يصل إلى 128 ألف رمز. ويتوفر هذا النموذج من خلال واجهة برمجة تطبيقات فعالة من حيث التكلفة، بسعر 0.14 دولاراً لكل مليون رمز إدخال و0.28 دولارًا لكل مليون رمز إخراج.

وفي سياق رحلة الشركة، فإن النماذج الأحدث (DeepSeek-V3 وDeepSeek-R1) عززت بشكل أكبر مكانتها كقوة مؤثرة في السوق.

يتميز DeepSeek-V3، وهو نموذج يحتوي على 671 مليار معامل، بأداء قوي في مجموعة متنوعة من المعايير، مع استهلاك موارد أقل بشكل ملحوظ مقارنة بنظرائه. أما DeepSeek-R1، الذي تم إطلاقه الشهر الجاري، فيركز على مهام الاستدلال ويشكل تحدياً لنموذج OpenAI o1 بفضل قدراته المتقدمة.

تقدم DeepSeek أيضًا مجموعة من النماذج المُقطّرة، المعروفة باسم DeepSeek-R1-Distill، والمستندة إلى نماذج مفتوحة المصدر شائعة مثل Llama وQwen، والتي تم تحسينها باستخدام بيانات اصطناعية تم إنشاؤها بواسطة R1. توفر هذه النماذج المُقطّرة مستويات متنوعة من الأداء والكفاءة لتلبية احتياجات الحوسبة المختلفة وتوافقها مع تكوينات الأجهزة المتعددة.

ويشير تقرير "فوربس" إلى أنه رغم أن DeepSeek حققت نجاحاً ملحوظاً خلال فترة قصيرة، فمن المهم ملاحظة أن الشركة تركز في المقام الأول على الأبحاث وليس لديها خطط مفصلة للتسويق على نطاق واسع في المستقبل القريب.

في الأسبوع الماضي، أطلقت DeepSeek نموذجاً مفتوح المصدر للذكاء الاصطناعي تفوق، وفقاً للتقارير، على نموذج OpenAI في عدة اختبارات.

وذكرت الشركة أنها طورت النموذج بتكلفة تقل عن 6 ملايين دولار، رغم شكوك وول ستريت حول هذا الرقم. ومع ذلك، يثير هذا الأمر مخاوف بشأن الاستثمارات الضخمة في بناء نماذج الذكاء الاصطناعي الكبيرة، إذ قد تُنفّذ بتكلفة أقل بكثير.

وفي مجموعة من اختبارات الأداء التي أجراها طرف ثالث، تفوق نموذج DeepSeek على نموذج Meta Llama 3.1، وOpenAI GPT-4، وAnthropic Claude Sonnet 3.5 من حيث الدقة، بدءاً من حل المشكلات المعقدة وصولاً إلى الرياضيات والبرمجة.

كما أصدرت DeepSeek يوم الاثنين نموذج r1 الخاص بالاستدلال، الذي تفوق أيضاً على أوبن إيه أي OpenAI في اختبارات الأداء الأخيرة.

شراكات

ويشار إلى أن الشركة أقامت شراكات استراتيجية لتعزيز قدراتها التكنولوجية ووصولها إلى السوق. ومن بين أوجه التعاون الجديرة بالملاحظة التعاون مع AMD الرائدة في توفير حلول الحوسبة عالية الأداء.

تستفيد DeepSeek من وحدات معالجة الرسوميات AMD Instinct وبرامج ROCM في المراحل الرئيسية من تطوير نموذجها، وخاصة بالنسبة لـ DeepSeek-V3. كما توفر هذه الشراكة للشركة الصينية الناشئة إمكانية الوصول إلى أجهزة متطورة ومجموعة برامج مفتوحة، مما يحسن الأداء وقابلية التوسع.


تأثير DeepSeek على مشهد الـ AI 

وخلق دخول شركة DeepSeek إلى سوق الذكاء الاصطناعي ضغوطًا تنافسية كبيرة على شركات عملاقة راسخة مثل OpenAI وGoogle وMeta ، من خلال تقديم نماذج فعّالة من حيث التكلفة ومفتوحة المصدر، تجبر DeepSeek هذه الشركات الكبرى على خفض أسعارها أو تحسين عروضها.

ومن المرجح أن تؤدي هذه المنافسة المتزايدة إلى حلول ذكاء اصطناعي أكثر بأسعار معقولة ويمكن الوصول إليها لكل من الشركات والمستهلكين، وفق فوربس.

بالإضافة إلى ذلك، أشعلت استراتيجية التسعير التخريبية لشركة DeepSeek بالفعل حرب أسعار داخل سوق نماذج الذكاء الاصطناعي الصينية، مما أجبر شركات التكنولوجيا الصينية العملاقة الأخرى على إعادة تقييم وتعديل هياكل التسعير الخاصة بها. تؤكد هذه الخطوة على قدرة DeepSeek على تعطيل الأسواق الراسخة والتأثير على ديناميكيات التسعير الإجمالية.

ويجعل التزام DeepSeek بالنماذج مفتوحة المصدر الوصول إلى تقنيات الذكاء الاصطناعي المتقدمة متاحًا للجميع، مما يتيح لمجموعة أوسع من المستخدمين، بما في ذلك الشركات الصغيرة والباحثين والمطورين، التعامل مع أدوات الذكاء الاصطناعي المتطورة.  ويعزز هذا الوصول من الابتكار ويساهم في نظام بيئي أكثر تنوعًا وحيوية للذكاء الاصطناعي.


قدرات متفاوتة.. ولكن

وبحسب محلل أشباه الموصلات في شركة ريموند جيمس، سري ني باغوري، في مذكرة يوم الاثنين 27 يناير/ كانون الثاني، فإنه "من الواضح أن شركة DeepSeek لا تمتلك نفس القدرات الحاسوبية التي تتمتع بها الشركات الأميركية العملاقة في الحوسبة السحابية، لكنها تمكنت بطريقة ما من تطوير نموذج يبدو منافسًا للغاية"، وفق CNBC.

وأضاف باغوري أن DeepSeek قد "تزيد من إلحاح" الشركات الأميركية الكبرى في هذا المجال، مثل أمازون ومايكروسوفت، موضحاً أن هذه الشركات يمكنها استغلال ميزة وصولها إلى وحدات معالجة الرسومات (GPUs) لتعزيز تفوقها مقارنة بالخيار الأرخص.

وتعد وحدات معالجة الرسومات (GPUs) جزءاً أساسياً من البنية التحتية اللازمة لتدريب النماذج الضخمة للذكاء الاصطناعي. وتعتبر Nvidia الشركة الرائدة في سوق وحدات معالجة الرسومات.


التكلفة.. كلمة السر

ووفقاً لمحللي CITI، فقد أصبحت تكلفة الحوسبة موضوعاً رئيسياً للنقاش بعد ظهور  DeepSeek، وأشاروا إلى أنه في حين قد تهدد هيمنة الشركات الأميركية على النماذج الأكثر تقدماً في الذكاء الاصطناعي، فإن الوصول إلى أفضل الرقائق يمثل عقبة رئيسية أمام المنافسين.

ونتيجة لذلك، من غير المرجح أن تتخلى الشركات الرائدة في مجال الذكاء الاصطناعي عن وحدات معالجة الرسومات (GPUs) الأكثر تقدماً.

وأضاف المحللون أن الإعلان الأسبوع الماضي عن مشروع Stargate AI بقيمة 500 مليار دولار يُبرز الحاجة إلى رقائق متقدمة.
من جهة أخرى، عبّر محللو Bernstein عن شكوكهم بشأن ما إذا كانت أداة DeepSeek قد طُورت فعلًا بتكلفة تقل عن 6 ملايين دولار، متسائلين عما إذا كانت هذه القيمة قد أغفلت تكاليف أخرى مرتبطة بالأبحاث والتجارب السابقة التي أوصلت التكنولوجيا إلى ما هي عليه اليوم.

وبالرغم من التأكيد على أن نماذج DeepSeek "تبدو مميزة"، أشار الفريق إلى أنه لا ينبغي اعتبارها "معجزات". وأضاف محللو Bernstein أن الذعر بشأن "انهيار منظومة البنية التحتية للذكاء الاصطناعي كما نعرفها" كان "مبالغًا فيه".


اقرأ أيضاً: باستثمارات نصف تريليون دولار.. ترامب يعلن عن مشروع مشترك بالبنية التحتية للذكاء الاصطناعي

تابعونا على منصات التواصل الاجتماعي

أخبار ذات صلة

الأكثر قراءة

الأكثر قراءة

سياسة ملفات الارتباط

ملف تعريف الارتباط هو نص صغير يتم إرساله إلى متصفحك من الموقع الإلكتروني الذي تتم زيارته. ويساعد هذا الملف الموقع الإلكتروني في تذكّر معلومات عن زيارتك، ما يسهّل زيارة الموقع مرّة أخرى ويتيح لك الاستفادة منه بشكل أفضل.