Presisi FP4 dari NVIDIA GB10 Superchip, yang memberi kekuatan pada digit dan perangkat seperti ASUS Ascent GX10, secara signifikan memengaruhi kinerja keseluruhannya dalam tugas komputasi AI. FP4 adalah format data yang memungkinkan pemrosesan beban kerja AI yang lebih cepat dan lebih efisien dengan menggunakan presisi yang dikurangi, yang sangat bermanfaat untuk aplikasi pembelajaran yang mendalam.
Kinerja yang ditingkatkan melalui presisi berkurang
Presisi FP4 adalah jenis format titik mengambang presisi yang berkurang yang menawarkan keseimbangan antara akurasi dan efisiensi komputasi. Dengan menggunakan bit yang lebih sedikit untuk mewakili angka, FP4 memungkinkan perhitungan yang lebih cepat dan peningkatan throughput, yang sangat penting untuk tugas AI yang membutuhkan sejumlah besar pemrosesan data. Ketepatan yang berkurang ini cukup untuk banyak aplikasi AI, karena mereka sering tidak memerlukan presisi penuh dari format yang lebih tinggi seperti FP32 atau FP64.
Dampak pada beban kerja AI
Dukungan GB10 Superchip untuk presisi FP4 memungkinkannya untuk memberikan hingga 1 petaflop kinerja AI, yang diterjemahkan menjadi 1 perhitungan quadrillion AI per detik [1] [10]. Tingkat kinerja ini sangat bermanfaat untuk tugas-tugas seperti prototipe, penyempurnaan, dan inferensi model AI besar. Misalnya, ASUS Ascent GX10 dapat menangani model AI dengan hingga 200 miliar parameter, dan ketika terhubung, dua sistem dapat mengelola model sebesar 405 miliar parameter, seperti Meta's Llama 3.1 [8].
Efisiensi dan Biaya Daya
Penggunaan presisi FP4 juga berkontribusi pada efisiensi daya superchip GB10. Dengan membutuhkan daya komputasi yang lebih sedikit untuk setiap operasi, chip dapat beroperasi dalam kendala outlet listrik standar, sehingga cocok untuk penyebaran desktop [3] [9]. Efisiensi ini, dikombinasikan dengan kinerja tinggi, menjadikan GB10 Superchip solusi ekonomis untuk pengembangan AI, memungkinkan pengembang untuk membuat prototipe dan menyempurnakan model secara lokal sebelum menggunakannya ke lingkungan cloud atau pusat data.
Kompatibilitas dan Ekosistem Perangkat Lunak
Presisi FP4 dari GB10 Superchip didukung oleh tumpukan perangkat lunak AI komprehensif NVIDIA, termasuk kerangka kerja seperti Pytorch dan alat yang tersedia melalui katalog NVIDIA NGC [9] [10]. Kompatibilitas ini memastikan bahwa pengembang dapat memanfaatkan berbagai alat dan perpustakaan AI untuk mengoptimalkan alur kerja mereka, lebih lanjut meningkatkan kinerja keseluruhan chip dalam aplikasi dunia nyata.
Singkatnya, ketepatan FP4 dari superchip GB10 adalah faktor kunci dalam kemampuannya untuk memberikan komputasi AI berkinerja tinggi sambil mempertahankan efisiensi dan efektivitas biaya. Ini menjadikannya solusi yang ideal bagi pengembang dan peneliti yang ingin bekerja dengan model AI besar pada skala desktop.
Kutipan:
[1] https://nvidianews.nvidia.com/news/nvidia-puts-bace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips
[2] https://www.nvidia.com/en-us/project-digits/
[3.
[4] https://www.nvidia.com/en-eu/project-digits/
[5] https://www.trendforce.com/news/2025/01/10/news-nvidias-gb10-superchip-in-project-digits-is-reportedy-built-with-tsmcs-3nm-node
[6] https://www.gurufocus.com/news/2647634/nvidia-uNVeils-project-digits-the-worlds-mallest-ai-supercomputer
[7] https://newsroom.arm.com/blog/arm-nvidia-project-digits-high-performance-ai
[8] https://www.techpowerup.com/334249/asus-uveils-new-ascent-gx10-mini-pc-pcowed-nvidia-g10-grace-blackwell-superchip
[9] https://www.hyperstack.cloud/blog/thought-leadership/nvidia-project-digits-all-you-need-to-now-about-the-blackwell-ai-supercomputer
[10] https://www.theverge.com/2025/1/6/24337530/nvidia-ces-digits-super-computer-ai