DeepSeek API는 처리 할 수있는 요청 수에 명시적인 요율 제한을 부과하지 않습니다. 이는 사용자가 이론적으로 세션 당 회전 수에 대한 제한에 직면하지 않고 많은 동시 요청을 할 수 있음을 의미합니다 [1] [2] [4]. 그러나 서버 용량 및 수요 변형으로 인한 실제 제한이 있습니다.
DeepSeek의 서버가 교통 압력이 높은 경우 사용자는 응답을받는 데 지연이 발생할 수 있습니다. API는 연결을 열어두고 스트리밍 요청에서 빈 라인을 반환하거나 연결을 유지하기위한 댓글을 유지할 수 있습니다 [1]. 30 분 후에 요청이 완료되지 않으면 서버가 연결을 닫습니다 [1].
요금 제한이 부족 했음에도 불구하고 DeepSeek은 수요가 서버 용량을 능가하는 데 어려움을 겪었습니다. 이로 인해 API 액세스에 대한 성능 문제, 지연 및 임시 제한이 수요를 관리하고 시스템 과부하를 방지했습니다 [7] [8]. 예를 들어, DeepSeek은 새로운 계정 가입을 중단하고 API 크레딧 톱 업을 중단하여 서버 스트레인을 관리했습니다 [8].
사용량을 최적화하는 측면에서 사용자는 DeepSeek의 컨텍스트 캐싱 기능을 활용하여 비용을 줄이고 효율성을 향상시킬 수 있습니다. 캐시 시스템은 64 개의 토큰을 저장 장치로 사용하며 64 개 미만의 토큰이 캐시되지 않습니다. 캐시 된 컨텐츠를 재사용하기위한 요청을 구성함으로써 사용자는 비용 절감을 극대화 할 수 있습니다 [4] [10].
전반적으로, 턴 수에 대한 명시 적 제한은 없지만, 사용자는 수요가 높은 기간 동안 잠재적 성능 문제를 알고 API 사용을 최적화하도록 계획해야합니다.
인용 :
[1] https://api-docs.deepseek.com/quick_start/rate_limit
[2] https://simonwillison.net/2025/jan/18/deepseek-api-docs-rate-limit/
[3] https://www.reddit.com/r/perplexity_ai/comments/1ibe1f6/there_shouldnt_be_any_limit_for_r1_model_for_pro/
[4] https://api-docs.deepseek.com/news/news0802
[5] https://www.byteplus.com/en/topic/384050
[6] https://www.byteplus.com/en/topic/384057
[7] https://www.bardeen.ai/answers/what-are-limitations-of-deepseek
[8] https://www.bloomberg.com/news/articles/2025-02-06/deepseek-limits-acccess-to-ai-model-as-demand-strains-capicacty
[9] https://www.reddit.com/r/localllama/comments/1i9jre5/the_browser_version_of_deepseek_r1_allows_for/
[10] https://www.datacamp.com/tutorial/deepseek-api