Κατακερματισμός μνήμης σε JAX: GPU VS TPU διαφορές

Πώς ο Jax χειρίζεται τον κατακερματισμό της μνήμης διαφορετικά σε GPU σε σύγκριση με τις TPU

Το JAX χειρίζεται διαφορετικά τον κατακερματισμό της μνήμης σε GPU σε σύγκριση με TPU λόγω της εγγενούς αρχιτεκτονικής και του σχεδιασμού αυτών των συσκευών.

κατακερματισμός μνήμης σε GPU

- Στρατηγική PREALLOCATION: Το JAX προ -προεξέχει το 75% της συνολικής μνήμης GPU από προεπιλογή όταν εκτελείται η πρώτη λειτουργία. Αυτή η στρατηγική ελαχιστοποιεί τα γενικά έξοδα κατανομής και τον κατακερματισμό μνήμης, αλλά μπορεί να οδηγήσει σε σφάλματα εκτός μνήμης εάν δεν διαχειρίζεται σωστά [1] [3].
- Θέματα κατακερματισμού μνήμης: Οι GPU έχουν μια σύνθετη ιεραρχία μνήμης, η οποία μπορεί να επιδεινώσει τα προβλήματα κατακερματισμού μνήμης. Αυτή η πολυπλοκότητα καθιστά δύσκολο για τον JAX να διαχειρίζεται αποτελεσματικά τη μνήμη χωρίς κατακερματισμό [6].
- Έλλειψη αυτόματης απόρριψης: Σε αντίθεση με τα TPU, οι GPU δεν έχουν ενσωματωμένη αυτόματη απόρριψη μνήμης στο JAX. Η εφαρμογή ενός τέτοιου χαρακτηριστικού θεωρείται αλλά δεν έχει προγραμματιστεί επί του παρόντος [7].

κατακερματισμός μνήμης σε TPU

- Απλοποιημένη ιεραρχία μνήμης: Τα TPU έχουν μια απλούστερη ιεραρχία μνήμης σε σύγκριση με τις GPU, γεγονός που μειώνει την πιθανότητα σημαντικών ζητημάτων κατακερματισμού μνήμης [6].
- Αυτόματη απόρριψη μνήμης: Το Backend TPU TFRT υποστηρίζει αυτόματη απόρριψη μνήμης, η οποία βοηθά στη διατήρηση της αποτελεσματικής χρήσης της μνήμης και μειώνει τον κατακερματισμό [7].
- Διαδοχική επεξεργασία: Δεδομένα διαδικασίας TPU διαδοχικά, τα οποία μπορούν να οδηγήσουν σε πιο προβλέψιμα πρότυπα χρήσης μνήμης και ενδεχομένως λιγότερους κατακερματισμούς σε σύγκριση με την παράλληλη επεξεργασία σε GPU [8].

Συνολικά, η διαχείριση της μνήμης του JAX σε GPU είναι πιο επιρρεπής στον κατακερματισμό λόγω της έλλειψης αυτόματης απόρριψης και της σύνθετης ιεραρχίας μνήμης GPU, ενώ τα TPU προσφέρουν μια πιο εξορθολογισμένη προσέγγιση με ενσωματωμένες δυνατότητες αποκατάστασης.

Αναφορές:
[1] https://jax.readthedocs.io/en/latest/gpu_memory_allocation.html
[2] https://arxiv.org/pdf/2309.07181.pdf
[3] https://kolonist26-jax-kr.readthedocs.io/en/latest/gpu_memory_allocation.html
[4] https://probeenings.neurips.cc/paper_files/paper/2023/file/42c40aff7814e9796266e12053b1c610-paper-conference.pdf
[5] https://docs.jax.dev/en/latest/device_memory_profiling.html
[6] https://massedcompute.com/faq-answers/?question=how+do+nvidia+gpus+handle+memory+Fragmentation+Comed+to+Tpus%3F
[7] https://github.com/google/jax/issues/9064
[8] https://docs.jax.dev/en/latest/pallas/tpu/details.html
[9] https://app.studyraid.com/en/read/11969/381958/memory-management-best-practices