Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon การแสดงของ Deepseek บน Harmbench เปรียบเทียบกับรุ่นชายแดนอื่น ๆ ได้อย่างไร


การแสดงของ Deepseek บน Harmbench เปรียบเทียบกับรุ่นชายแดนอื่น ๆ ได้อย่างไร


แบบจำลอง R1 ของ Deepseek ได้รับการประเมินกับแบบจำลอง AI ชายแดนอื่น ๆ โดยใช้เกณฑ์มาตรฐาน Harmbench ซึ่งประเมินความอ่อนแอของแบบจำลองต่อการแจ้งเตือนที่เป็นอันตรายในประเภทต่างๆเช่นอาชญากรรมไซเบอร์ข้อมูลที่ผิดและกิจกรรมที่ผิดกฎหมาย นี่คือการเปรียบเทียบรายละเอียดของประสิทธิภาพของ Deepseek กับรุ่นอื่น ๆ :

การแสดง Deepseek R1

- ช่องโหว่: Deepseek R1 แสดงอัตราความสำเร็จในการโจมตี 100% เมื่อทดสอบกับ 50 การสุ่มพรอมต์จากชุดข้อมูล Harmbench ซึ่งหมายความว่ามันล้มเหลวในการบล็อกพรอมต์ที่เป็นอันตรายใด ๆ ให้คำตอบยืนยันทุกครั้ง [1] [2] [3]
- ข้อบกพร่องด้านความปลอดภัย: แบบจำลองการขาดกลไกความปลอดภัยที่แข็งแกร่งทำให้มีความอ่อนไหวอย่างมากต่อการแหกคุกอัลกอริทึมซึ่งเป็นเทคนิคที่ใช้ในการข้ามข้อ จำกัด ด้านความปลอดภัยของ AI [1] [4]
- เปรียบเทียบกับคู่แข่ง: ประสิทธิภาพของ Deepseek ในแง่ของความสามารถในการใช้เหตุผลคู่แข่งแบบจำลองเช่น OpenAI's O1 แต่ความปลอดภัยและความปลอดภัยของมันลดลงอย่างมากเมื่อเทียบกับรุ่นเหล่านี้ [1] [2]

เปรียบเทียบกับรุ่นชายแดนอื่น ๆ

-Openai O1-Preview: รุ่นนี้แสดงให้เห็นถึงอัตราความสำเร็จในการโจมตีที่ต่ำกว่ามากถึง 26%ซึ่งบ่งชี้ว่ามันถูกปิดกั้นการแจ้งเตือนที่เป็นอันตรายมากที่สุดโดยใช้ guardrails ในตัว [3] [5]
- Meta's Llama 3.1: รุ่นนี้มีอัตราความสำเร็จในการโจมตี 96%แสดงให้เห็นว่ามันมีความเสี่ยงสูง แต่น้อยกว่า Deepseek [3] [5]
- Gemini 1.5 Pro ของ Google: ด้วยอัตราความสำเร็จในการโจมตี 64%ราศีเมถุนก็ตกอยู่ตรงกลางมีการต่อต้านมากกว่า Deepseek แต่น้อยกว่าการตรวจสอบ O1 ของ Openai [5]
- Claude 3.5 Sonnet ของ Anthropic: รุ่นนี้มีอัตราความสำเร็จในการโจมตี 26%คล้ายกับ Opt ของ OpenAI ซึ่งแสดงถึงคุณสมบัติด้านความปลอดภัยที่แข็งแกร่ง [5]

โดยรวมในขณะที่ Deepseek R1 แสดงประสิทธิภาพที่น่าประทับใจในบางงานการขาดคุณสมบัติด้านความปลอดภัยและความปลอดภัยทำให้มีความเสี่ยงที่จะใช้ในทางที่ผิดเมื่อเทียบกับรุ่นชายแดนอื่น ๆ

การอ้างอิง:
[1] https://blogs.cisco.com/security/evaluating-security-risk-in-deepseek-and-other-frontier-reasoning-models
[2] https://www.internetgovernance.org/2025/02/21/the-frontier-illusion-rethinking-deepseks-ai-threat/
[3] https://futurism.com/deepseek-failed-every-security-test
[4] https://www.aisharenet.com/en/sikedui-deepseek-a/
[5] https://www.itpro.com/technology/artificial-intelligence/deepseek-r1-model-jailbreak-security-flaws
[6] https://www.haizelabs.com/technology/endless-jailbreaks-with-bijection-learning-a-powerful-scale-agnostic-attack-method
[7] https://www.telecomreviewasia.com/news/featured-articles/4835-deepseek-r1-hakes-pake-pake-pake-the-the-ai-industry
[8] https://procogia.com/should-your-organization-switch-to-deepseek/
[9] https://www.securityweek.com/deepseek-compared-to-chatgpt-gemini-in-ai-jailbreak-test/
[10] https://www.datacamp.com/blog/deepseek-r1