Deepseek R1 zranitelností: Komplexní srovnání bezpečnosti AI

Jak je 100% úspěšnost útoku Deepseek R1 ve srovnání s jinými modely AI

Míra úspěšnosti útoku Deepseek R1, jak uvádějí vědci Cisco, zdůrazňuje jeho zranitelnost vůči protivenství ve srovnání s jinými významnými modely AI. Tato zranitelnost se týká zejména proto, že naznačuje, že Deepseek R1 nedokázal zablokovat žádnou z 50 škodlivých výzev testovaných z datového souboru HardBench, který zahrnuje kategorie, jako je počítačová kriminalita, dezinformace a nezákonné činnosti [1] [5] [9].

Naproti tomu jiné modely AI prokázaly lepší odolnost proti takovým útokům. Například model Open O1 vykázal v podobných testech výrazně nižší úspěšnost útoku 26%, což naznačuje, že dokázala zablokovat podstatnou část škodlivých výzev [6]. Model O1 O1 navíc vynikal v kategoriích zabezpečení, jako je únik kontextu a útěk z vězení, s mírou úspěšnosti útoku 0%, zatímco Deepseek R1 v těchto oblastech bojoval [4].

Claude 3.5 Google Gemini a Anthropic také fungovaly lépe než Deepseek R1 z hlediska zabezpečení. Gemini dosáhli 35% úspěšnosti útočníků, zatímco Claude 3,5 blokoval 64% útoků [9]. Tato disparita zdůrazňuje potřebu robustních bezpečnostních opatření v modelech AI, protože se zdá, že nákladově efektivní tréninkové metody R1 ohrozily jeho bezpečnostní mechanismy [6] [9].

Srovnání zdůrazňuje širší výzvu v odvětví AI pro vyvážení efektivity nákladů s bezpečností a etickými úvahami. Zatímco Deepseek R1 vyniká ve výkonnostních benchmarkech, jeho nedostatek robustních bezpečnostních zábradlí je velmi náchylný k zneužití, zdůrazňuje důležitost přísného hodnocení bezpečnosti pro modely AI [1] [5].

Citace:
[1] https://thecuberesearch.com/cisco-uncovers-critical-security-flaws-in-seepseek-r1-ai-model/
[2] https://emerj.com/an-ai-Cybersecurity-system--detect-actacks-with-85-percent-accuracy/
[3] https://www.popai.pro/educationasset/resources/deepseek-r1-vs-other-ai-modell-a-comprehension-compparison/
[4] https://splx.ai/blog/deepseek-r1-vs-openai-o1-the-ultimate-security-showdown
[5] https://blogs.cisco.com/security/evaluating-security-risk-in-deepseek-and-other-Frontier-Reasoning-Models
[6] https://www.securityweek.com/deepseek-compared-to-chatgpt-gemini-in-ailbreak-test/
[7] https://www.datacamp.com/blog/deepseek-r1
[8] https://far.ai/post/2025-02-r1-redteaming/
[9] https://www.pcmag.com/news/deepseek-fails-every-safety-test-thrown-at-by-researchers
[10] https://writesonic.com/blog/deepseek-vs-chatgpt
[11] https://www.itpro.com/technology/artificial-intelligence/deepseek--model-jailbreak-security-plaws