Stacja NVIDIA DGX, potężna stacja robocza zaprojektowana do głębokiego uczenia się i analizy AI, ma kilka ukrytych kosztów i potencjalnych nieoczekiwanych wydatków, o których użytkownicy powinni być świadomi:
1. Koszty utrzymania i wsparcia: Stacja DGX wymaga znacznej rocznej umowy o utrzymaniu. W przypadku starszych modeli, takich jak stacja DGX z GPU Tesla V100, standardowa gwarancja kosztuje około 10 000 USD rocznie, przy minimalnym zaangażowaniu jednego roku [3]. Koszt ten nie jest uwzględniony w początkowej cenie zakupu i z czasem może się sumować. W przypadku nowszych modeli prawdopodobnie mają zastosowanie podobne koszty wsparcia.
2. Zużycie energii: Stacja DGX ma wysokie zużycie energii, przy czym starsze modele wymagają do 1500 W [5]. Może to prowadzić do zwiększenia rachunków za energię elektryczną i może wymagać ulepszenia infrastruktury energetycznej w Twoim obiekcie, co może być kosztowne.
3. Konserwacja systemu chłodzenia: Stacja DGX wykorzystuje system chłodzenia wody, który może być podatny na problemy takie jak awarie pompy, zwłaszcza jeśli nie jest odpowiednio utrzymane [2]. Regularne czyszczenie i konserwacja ma kluczowe znaczenie dla zapobiegania przegrzaniu i awarii systemu. Jeśli system nie jest odpowiednio utrzymany, może wymagać kosztownych napraw, a nawet wymiany.
4. Odzyskiwanie danych i tworzenie kopii zapasowych: Poleganie stacji DGX od zastrzeżonego sprzętu do odzyskiwania danych może prowadzić do znacznych przestojów i kosztów, jeśli pamięć nie powiedzie się. Niezbędne jest posiadanie solidnej strategii tworzenia kopii zapasowych, takiej jak korzystanie z zewnętrznych rozwiązań pamięci masowej lub usług w chmurze, w celu ograniczenia tych ryzyka [1].
5. Koszty aktualizacji i wymiany: Biorąc pod uwagę wysoki koszt komponentów stacji DGX, takich jak GPU, aktualizacja lub wymiana części mogą być drogie. Ponadto niestandardowa konstrukcja systemu może ograniczać kompatybilność z komponentami stron trzecich, a dalsze zwiększenie kosztów.
6. Wymagania dotyczące przestrzeni i środowiska: Stacja DGX jest ciężka i wymaga czystego, pozbawionego pyłu, dobrze wentylowanego środowiska do skutecznego działania [4]. Może to wymagać dodatkowych inwestycji w infrastrukturę, aby zapewnić optymalne warunki.
Podsumowując, podczas gdy stacja DGX oferuje potężne możliwości dla sztucznej inteligencji i zadań głębokiego uczenia się, ma znaczne bieżące koszty i potencjalne wydatki związane z konserwacją, zużyciem energii, utrzymaniem systemu chłodzenia, zarządzaniem danymi i infrastrukturą.
Cytaty:
[1] https://www.reddit.com/r/machinelearning/comments/lswpni/d_is_a_dgx_a100_worth_it/
[2] https://www.reddit.com/r/watercooling/comments/1it9rzf/nvidia_dgx_station_a100s_overheating/
[3] https://forums.developer.nvidia.com/t/anyone-has-experiences-with-ordering-dgx-1-dgx-station/50528
[4] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[5] https://www.servethehome.com/nvidia-dgx-station-upgraded-tesla-v100/
[6] https://www.reddit.com/r/localllama/comments/1Jedolw/nvidia_dgx_station_and_digits_officially_branded/
[7] https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-unveils-dgx-station-WorkStation-PCS-GB300-BLACKWELL-ULTRA-INSIDE
[8] https://www.transit.dot.gov/sites/fta.dot.gov/files/docs/research-innovation/114661/strateic-transit-automation-research-report-no-0116_0.pdf
[9] https://www.pcmag.com/news/what-is-nvidias-dgx-station-a-new-specialed-desktop-line-for-ai-work