Долгосрочные затраты на техническое обслуживание, связанные со станцией NVIDIA DGX, включают несколько компонентов, которые способствуют его общему содержанию и эксплуатационным расходам. Вот подробный срыв:
1. Контракты на поддержку и техническое обслуживание: годовая стоимость договора поддержки от Nvidia составляет приблизительно 67 050 долл. США, что имеет решающее значение для обеспечения дальнейшей поддержки и обслуживания станции DGX [1]. Эта стоимость является частью общих расходов на поддержку, которые организации должны ежегодно бюджет.
2. Поддержка на полный рабочий день (FTE): организации обычно требуют одного FTE для поддержки и поддержания станции DGX. Средняя полностью обремененная зарплата для этой роли составляет около 140 000 долларов в год [1]. Эта стоимость необходима для обеспечения правильного управления и обслуживания системы.
3. Затраты на поддержку с поправкой на риск. Из-за потенциальных сложностей в поддержке станции DGX, такой как дефицит во внутренних навыках поддержки или сложных среда, эти затраты часто корректируются вверх примерно на 10%[1]. Эта корректировка отражает дополнительные проблемы, с которыми могут столкнуться некоторые организации при эффективном поддержании системы.
4. Замена аппаратного обеспечения и обновления: со временем, такие компоненты, как SSD или DIMM, могут потребовать замены. Стоимость этих компонентов и труда, необходимый для замены, могут добавить к долгосрочным затратам на техническое обслуживание. Например, замена SSD включает не только стоимость нового SSD, но и время, необходимое для восстановления массива RAID, если это необходимо [3].
5. Обновления и обслуживания программного обеспечения: в то время как обновления программного обеспечения доступны, что важно, чтобы станция DGX оставалась актуальной с последними исправлениями безопасности и версиями программного обеспечения. Это требует регулярных проверок для обновлений и потенциально ручного вмешательства для применения этих обновлений, которые могут потреблять ИТ -ресурсы [2].
6. Потребление энергии: хотя станция DGX предназначена для энергосбережения, она все еще потребляет значительную мощность, особенно в крупномасштабных развертываниях. Эта текущая стоимость энергии должна учитываться в долгосрочных затратах на техническое обслуживание [6].
7. Соглашения о простоях и техническом обслуживании: как отмечено в некоторых пользовательских опытах, может возникнуть время простоя, и для снижения этих рисков могут быть необходимы соглашения о техническом обслуживании. Годовые соглашения о техническом обслуживании могут стоить около 12 000 долл. США, что должно быть включено в общий бюджет обслуживания [7].
Таким образом, долгосрочные затраты на техническое обслуживание на станции DGX включают в себя контракты на поддержку, затраты на персонал, оборудование, обслуживание программного обеспечения, энергопотребление и потенциальные стратегии смягчения простоя. Эти затраты подчеркивают важность тщательного планирования и бюджета для организаций, инвестирующих в эту технологию.
Цитаты:
[1] https://www.vion.com/wp-content/uploads/2019/04/the-total-comonomic-impact-of-nvidia-dgx1-march-2018-final.pdf
[2] http://cdn.cnetcontent.com/2f/ed/2fed407b-03de-4bda-86b4-64cb9ec20a50.pdf
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://images.nvidia.com/aem-dam/solutions/data-centter/nvidia-dgx-station-a100-dindulial-ry-brief.pdf
[5] https://docs.nvidia.com/dgx/dgx-station-user-guide/index.html
[6] https://www.fibermall.com/blog/nvidia-hgx-vs-dgx.htm
[7] https://www.reddit.com/r/machinelearning/comments/lswpni/d_is_a_dgx_a100_worth_it/
[8] https://docs.nvidia.com/dgx/dgx-station-a100-service-manual/index.html