Уразливості DeepSeek R1: всебічне порівняння безпеки AI

Як 100 -відсотковий рівень успішності атаки Deepseek R1 порівнюється з іншими моделями AI

100 -відсотковий рівень успішності атаки Deepseek R1, як повідомляли дослідники Cisco, підкреслює його вразливість до змагальних атак порівняно з іншими видатними моделями ШІ. Ця вразливість особливо стосується тому, що вона вказує на те, що DeepSeek R1 не зміг заблокувати жодного з 50 шкідливих підказок, перевірених з набору даних Harmbench, що включає такі категорії, як кіберзлочинність, дезінформація та незаконна діяльність [1] [5] [9].

На відміну від цього, інші моделі AI продемонстрували кращу стійкість проти таких атак. Наприклад, модель O1 Opeai показала значно нижчий рівень успішності атаки 26% у подібних тестах, що свідчить про те, що вона змогла заблокувати значну частину шкідливих підказок [6]. Крім того, модель O1 O1 відзначилася в категоріях безпеки, таких як витік контексту та джейлбрейк, з рівнем успіху атаки 0%, тоді як DeepSeek R1 боровся в цих сферах [4].

Gemini та Antropic's Claude 3.5 також працювали краще, ніж DeepSeek R1 з точки зору безпеки. Близнюки досягли 35% успішності для зловмисників, а Клод 3,5 заблокував 64% атак [9]. Ця невідповідність підкреслює необхідність надійних заходів безпеки в моделях AI, оскільки, схоже, економічно ефективні методи навчання DeepSeek R1 [6] [9].

Порівняння підкреслює більш широкий виклик у галузі АІ врівноваженої економічної ефективності з безпекою та етичними міркуваннями. Хоча Deepseek R1 переважає в орієнтирах продуктивності, його відсутність надійних охорони безпеки робить його дуже сприйнятливим до зловживання, підкреслюючи важливість суворої оцінки безпеки для моделей AI [1] [5].

Цитати:
[1] https://thecuberesearch.com/cisco-uncovers-critical-security-flaws-in-deepseek-r1-ai-model/
[2] https://emerj.com/an-ai-cybersecurity-system-may-detect-attacks-with-85-percent-accurracy/
[3] https://www.popai.pro/educationasset/resources/deepseek-r1-vs-other-ai-models-a-comprehence-performance-comparison/
[4] https://splx.ai/blog/deepseek-r1-vs-openai-o1-the-ultimate-security-showdown
[5] https://blogs.cisco.com/security/evaluting-security-risk-in-deepseek-and-other-frontier-rasoning-models
[6] https://www.securityweek.com/deepseek-compared-to-chatgpt-gemini-in-ai-jailbreak-test/
[7] https://www.datacamp.com/blog/deepseek-r1
[8] https://far.ai/post/2025-02-r1-redteaming/
[9] https://www.pcmag.com/news/deepseek-fails-every-safety-test-thrown-at-it-by-researchers
[10] https://writesonic.com/blog/deepseek-vs-chatgpt
[.