DeepSeek의 상업용 상용 기성품 (COTS) 하드웨어 사용 몇 가지 주요 방식으로 비용 효율성을 크게 향상시킵니다.
1. 인프라 비용 절감 : COTS 하드웨어를 활용하여 DeepSeek는 고성능 AI 개발에 일반적으로 필요한 비싸고 특수 시스템이 필요하지 않습니다. 이 접근법은 인프라 비용을 삭감하여 소규모 기업에 고급 AI 기능을보다 쉽게 이용할 수있게하고 AI 시장 진입에 대한 재정적 장벽을 줄입니다 [1] [3].
2. 최적화 된 자원 활용 : DeepSeek의 전략에는 기존 리소스에서 최대 값을 추출하기 위해 소프트웨어를 최적화해야합니다. MOE (Mix-of-Experts) 아키텍처와 같은 기술을 통해 모델은 특정 작업에 필요한 매개 변수 만 활성화하여 계산 폐기물을 최소화하며 고급 GPU의 필요성을 줄일 수 있습니다 [3] [10]. 이 목표 접근 방식은 비용을 줄일뿐만 아니라 하드웨어 수명을 연장하고 에너지 소비를 줄입니다.
3. 간소화 된 훈련 과정 : DeepSeek은 전임에서 인간의 피드백 (RLHF)의 강화 학습에 이르기까지 직접 파이프 라인을 구현함으로써 감독 된 Fine-Shot (SFS) 단계와 같은 전통적인 훈련 단계를 우회합니다. 이 간소화 된 프로세스는 모델 개발에 필요한 교육 시간과 계산 리소스를 모두 줄여 비용 효율성에 더욱 기여합니다 [1] [3].
4. 지식 증류 : Deepseek은 성능 저하없이 지식을 더 큰 모델에서 작은 모델로 성공적으로 증류합니다. 예를 들어, 671b 매개 변수 모델을 70b 모델로 압축하여 거의 동일한 성능을 유지했습니다. 이러한 모델 크기의 효율성은 덜 강력한 하드웨어에 배포되어 COTS 전략과 일치하고 운영 비용을 줄일 수 있습니다 [1] [3].
그러나 DeepSeek의 실제 하드웨어 투자가 처음 주장한 것보다 더 실질적 일 수 있으며 추정치가 GPU에 대한 상당한 지출을 나타내는 보고서도 있습니다 [4]. 그럼에도 불구하고, 비용 효율적인 하드웨어를 활용하고 소프트웨어 효율성을 최적화하는 회사의 접근 방식은 OpenAI [2] [3]와 같은 경쟁 업체에 비해 비용 효율성의 핵심 요소로 남아 있습니다.
전반적으로, DeepSeek의 혁신적인 소프트웨어 최적화와 결합 된 DeepSeek의 COTS 하드웨어 사용은 비용 효율적인 AI 개발의 리더로 위치하여 AI 환경에서 재무 및 전략적 이점을 모두 제공합니다 [2] [3].
인용 :
[1] https://fabrix.ai/blog/deepseek-revolutizing-ai-development-through-costective-innovation/
[2] https://www.linkedin.com/pulse/deepseek-vs-openai-comparison-ai-stradeings-hardware-costs-george-l5n3e
[3] https://www.chitika.com/deepseek-enterprise-mentrications/
[4] https://economictimes.com/news/international/us/was-it-a-lie-by-thinese-startup-industry-analyst-says-deepseek-incurred-1-billion-in-hardware-costs-and-has-a-fleet-of-50000-nvidia-hopper-gpus/artcleshow/11789440.cms
[5] https://www.reddit.com/r/localllama/comments/1hp6ejz/seeking_advice_on_costeffective_hardware_for/
[6] https://cloudfabrix.com/blog/deepseek-revolutizing-ai-development-through-costective-innovation/
[7] https://www.capacitymedia.com/article/behind-the-deepseek-cop-costs-safety-and-censorship- 여기
[8] https://www.byteplus.com/en/topic/382891
[9] https://www.reddit.com/r/singularity/comments/1id60qi/big_misconceptions_of_training_costs_for_deepseek/
[10] https://news.cgtn.com/news/2025-02-09/catalyst-deepseek--innovation-behind-ics-cost-efficiency-1arbdoshtq8/p.html