Les coûts de maintenance à long terme associés à la station NVIDIA DGX comprennent plusieurs composants qui contribuent à ses dépenses globales d'entretien et d'exploitation. Voici une ventilation détaillée:
1. Contrats de soutien et de maintenance: le coût annuel d'un contrat de soutien de NVIDIA est d'environ 67 050 $, ce qui est crucial pour assurer le soutien et la maintenance continues de la station DGX [1]. Ce coût fait partie des dépenses globales de soutien auxquelles les organisations doivent budgétiser chaque année.
2. Support équivalent à temps plein (ETP): les organisations nécessitent généralement un ETP pour soutenir et maintenir la station DGX. Le salaire moyen entièrement accablé pour ce rôle est d'environ 140 000 $ par an [1]. Ce coût est essentiel pour garantir que le système est correctement géré et maintenu.
3. Cet ajustement reflète les défis supplémentaires auxquels certaines organisations pourraient être confrontées dans le maintien efficacement du système.
4. Remplacement du matériel et mises à niveau: Au fil du temps, des composants tels que les SSD ou les DIMM peuvent nécessiter un remplacement. Le coût de ces composants et la main-d'œuvre requis pour le remplacement peuvent s'ajouter aux dépenses de maintenance à long terme. Par exemple, le remplacement d'un SSD implique non seulement le coût du nouveau SSD, mais aussi le temps nécessaire pour reconstruire le tableau RAID si nécessaire [3].
5. Mises à jour logicielles et entretien: tandis que les mises à jour logicielles sont disponibles, garantissant que la station DGX reste à jour avec les derniers correctifs de sécurité et versions logicielles est cruciale. Cela nécessite des vérifications régulières des mises à jour et une intervention potentiellement manuelle pour appliquer ces mises à jour, qui peuvent consommer des ressources informatiques [2].
6. Consommation d'énergie: Bien que la station DGX soit conçue pour être économe en énergie, elle consomme toujours une puissance importante, en particulier dans les déploiements à grande échelle. Ce coût énergétique en cours devrait être pris en compte dans les frais de maintenance à long terme [6].
7. Constructions d'arrêt et de maintenance: Comme indiqué dans certaines expériences utilisateur, les temps d'arrêt peuvent se produire et des accords de maintenance peuvent être nécessaires pour atténuer ces risques. Les accords de maintenance annuels peuvent coûter environ 12 000 $, ce qui devrait être inclus dans le budget de maintenance global [7].
En résumé, les coûts de maintenance à long terme de la station DGX englobent des contrats de support, les coûts du personnel, les remplacements matériels, l'entretien des logiciels, la consommation d'énergie et les stratégies potentielles d'atténuation des temps d'arrêt. Ces coûts mettent en évidence l'importance d'une planification approfondie et d'une budgétisation pour les organisations qui investissent dans cette technologie.
Citations:
[1] https://www.vion.com/wp-content/uploads/2019/04/the-total-economic-impact-of-nvidia-dgx1-march-2018-final.pdf
[2] http://cdn.cnetcontent.com/2f/ed/2fed407b-03de-4bda-86b4-64cb9ec20a50.pdf
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://images.nvidia.com/aem-dam/solutions/data-center/nvidia-dgx-station-a100-industrial-solution-brief.pdf
[5] https://docs.nvidia.com/dgx/dgx-station-user-guide/index.html
[6] https://www.fibermall.com/blog/nvidia-hgx-vs-dgx.htm
[7] https://www.reddit.com/r/machinelearning/comments/lswpni/d_is_a_dgx_a100_worth_it/
[8] https://docs.nvidia.com/dgx/dgx-station-a100-service-manual/index.html