نقاط الضعف Deepseek R1: مقارنة شاملة من أمن الذكاء الاصطناعي

كيف يقارن معدل نجاح الهجوم بنسبة 100 ٪ من Deepseek R1 بنماذج الذكاء الاصطناعى الأخرى

يبرز معدل نجاح الهجوم بنسبة 100 ٪ من Deepseek R1 ، وفقًا لما ذكره باحثو Cisco ، ضعفه في هجمات الخصوم مقارنة بنماذج الذكاء الاصطناعى البارزين الأخرى. هذا الضعف يهم بشكل خاص لأنه يشير إلى أن Deepseek R1 فشل في منع أي من المطالبات الخمسين الضارة التي تم اختبارها من مجموعة بيانات Harmbench ، والتي تشمل فئات مثل الجرائم الإلكترونية ، والمعلومات الخاطئة ، والأنشطة غير القانونية [1] [5] [9].

في المقابل ، أظهرت نماذج منظمة العفو الدولية الأخرى مرونة أفضل ضد مثل هذه الهجمات. على سبيل المثال ، أظهر نموذج Openai O1 معدل نجاح هجوم أقل بكثير من 26 ٪ في اختبارات مماثلة ، مما يشير إلى أنه كان قادرًا على منع جزء كبير من المطالبات الضارة [6]. بالإضافة إلى ذلك ، تفوق نموذج Openai O1 في فئات الأمن مثل تسرب السياق وسرقة السجن ، مع معدل نجاح الهجوم بنسبة 0 ٪ ، في حين كافح Deepseek R1 في هذه المناطق [4].

قام كلود 3.5 من Google's Gemini و Claude 3.5 بشكل أفضل من Deepseek R1 من حيث الأمان. حقق Gemini معدل نجاح بنسبة 35 ٪ للمهاجمين ، في حين حظر Claude 3.5 64 ٪ من الهجمات [9]. يؤكد هذا التباين على الحاجة إلى تدابير أمنية قوية في نماذج الذكاء الاصطناعي ، حيث يبدو أن أساليب التدريب الموفرة من حيث التكلفة في Deepseek R1 قد تعرضت للخطر آليات السلامة [6] [9].

تبرز المقارنة التحدي الأوسع في صناعة الذكاء الاصطناعي المتمثلة في تحقيق التوازن بين كفاءة التكلفة مع الأمن والاعتبارات الأخلاقية. في حين أن Deepseek R1 يتفوق في معايير الأداء ، فإن افتقارها إلى الدرابزين الأمني القوي يجعل من المعرضة للاستخدام ، مع التأكيد على أهمية التقييمات الأمنية الصارمة لنماذج الذكاء الاصطناعي [1] [5].

الاستشهادات:
[1]
[2]
[3 "
[4] https://splx.ai/blog/deepseek-r1-vs-openai-o1-the-ultimate-security-howdown
[5] https://blogs.cisco.com/security/evaluating-seCurity-Risk-in-deepseek-and-phrontier-reasoning-models
[6]
[7] https://www.datacamp.com/blog/deepeek-r1
[8] https://far.ai/post/2025-02-r1-redteaming/
[9] https://www.pcmag.com/news/deepseek-fails- every-safety-test-thrown-at-it-by-researchers
[10] https://writesonic.com/blog/deepeek-vs-chatgpt
[11] https://www.itpro.com/technology/artificial-intelligence/deepeek-r1-model-jailbreak-security-flaws