L'API Deepseek n'impose pas de limites de taux explicites au nombre de demandes ou de virages qu'il peut gérer. Cela signifie que les utilisateurs peuvent théoriquement faire un grand nombre de demandes simultanées sans faire face à des restrictions sur le nombre de tours par session [1] [2] [4]. Cependant, il existe des limitations pratiques en raison de la capacité du serveur et de la tension de la demande.
Lorsque les serveurs de Deepseek sont soumis à une pression de circulation élevée, les utilisateurs peuvent subir des retards dans la réception des réponses. L'API gardera la connexion ouverte et peut retourner des lignes vides ou des commentaires de conservation dans les demandes de streaming pour maintenir la connexion [1]. Si une demande n'est pas terminée après 30 minutes, le serveur fermera la connexion [1].
Malgré le manque de limites de taux, Deepseek a fait face à des défis avec la demande dépassant la capacité de son serveur. Cela a conduit à des problèmes de performances, des retards et même des restrictions temporaires sur l'accès à l'API pour gérer la demande et empêcher la surcharge du système [7] [8]. Par exemple, Deepseek a suspendu les nouvelles inscriptions de compte et interrompu les recharges de crédit API pour gérer la contrainte du serveur [8].
En termes d'optimisation de l'utilisation, les utilisateurs peuvent tirer parti de la fonction de mise en cache de contexte de Deepseek pour réduire les coûts et améliorer l'efficacité. Le système de cache utilise 64 jetons comme unité de stockage et le contenu inférieur à 64 jetons n'est pas mis en cache. En structurant les demandes de réutilisation du contenu mis en cache, les utilisateurs peuvent maximiser les économies de coûts [4] [10].
Dans l'ensemble, bien qu'il n'y ait pas de limites explicites sur le nombre de virages, les utilisateurs doivent être conscients des problèmes de performance potentiels pendant les périodes de demande élevées et prévoient en conséquence d'optimiser leur utilisation de l'API.
Citations:
[1] https://api-docs.deepseek.com/quick_start/rate_limit
[2] https://simonwillison.net/2025/jan/18/deepseek-api-docs-rate-limit/
[3] https://www.reddit.com/r/perplexity_ai/comments/1ibe1f6/there_shouldnt_be_any_limit_for_r1_model_for_pro/
[4] https://api-docs.deepseek.com/news/news0802
[5] https://www.byteplus.com/en/topic/384050
[6] https://www.byteplus.com/en/topic/384057
[7] https://www.bardeen.ai/answers/what-are-the-limitations-of-eepseek
[8] https://www.bomberg.com/news/articles/2025-02-06/deepseek-limits-access-to-ai-model-as-demand-strains-capacity
[9] https://www.reddit.com/r/localllama/comments/1i9jre5/the_browser_version_of_deepseek_r1_allows_for/
[10] https://www.datacamp.com/tutorial/deepseek-api