Phân mảnh bộ nhớ trong JAX: GPU vs TPU khác biệt

Làm thế nào để Jax xử lý phân mảnh bộ nhớ khác nhau trên GPU so với TPUS

JAX xử lý phân mảnh bộ nhớ khác nhau trên GPU so với TPU do kiến trúc và thiết kế vốn có của các thiết bị này.

Phân mảnh bộ nhớ trên GPUS

- Chiến lược Preallocation: Jax Preallocates 75% tổng số bộ nhớ GPU theo mặc định khi hoạt động đầu tiên được chạy. Chiến lược này giảm thiểu chi phí phân bổ và phân mảnh bộ nhớ nhưng có thể dẫn đến các lỗi ngoài bộ nhớ nếu không được quản lý đúng [1] [3].
- Vấn đề phân mảnh bộ nhớ: GPU có hệ thống phân cấp bộ nhớ phức tạp, có thể làm trầm trọng thêm các vấn đề phân mảnh bộ nhớ. Sự phức tạp này khiến JAX thách thức để quản lý bộ nhớ một cách hiệu quả mà không bị phân mảnh [6].
- Thiếu độ phân hủy tự động: Không giống như TPU, GPU không có sự phân rã bộ nhớ tự động tích hợp trong JAX. Việc thực hiện một tính năng như vậy được xem xét nhưng hiện không được lên kế hoạch [7].

Phân mảnh bộ nhớ trên TPUS

- Hệ thống phân cấp bộ nhớ đơn giản hóa: TPU có hệ thống phân cấp bộ nhớ đơn giản hơn so với GPU, làm giảm khả năng các vấn đề phân mảnh bộ nhớ đáng kể [6].
- Phân tích bộ nhớ tự động: Phần phụ trợ TPRT TPU hỗ trợ phân rã bộ nhớ tự động, giúp duy trì việc sử dụng bộ nhớ hiệu quả và giảm phân mảnh [7].
- Xử lý tuần tự: Dữ liệu xử lý TPU theo tuần tự, có thể dẫn đến các mẫu sử dụng bộ nhớ có thể dự đoán được hơn và có khả năng phân mảnh ít hơn so với xử lý song song trên GPU [8].

Nhìn chung, quản lý bộ nhớ của JAX trên GPU dễ bị phân mảnh hơn do thiếu sự phân rã tự động và phân cấp bộ nhớ GPU phức tạp, trong khi TPU cung cấp một cách tiếp cận hợp lý hơn với khả năng phân rã tích hợp.

Trích dẫn:
[1] https://jax.readthedocs.io/en/latest/gpu_memory_allocation.html
[2] https://arxiv.org/pdf/2309.07181.pdf
[3] https://kolonist26-jax-kr.readthedocs.io/en/latest/gpu_memory_allocation.html
[4] https://proceedings.neurips.cc/paper_files/paper/2023/file/42c40aff7814e9796266e12053b1c610-Paper-Conference.pdf
[5] https://docs.jax.dev/en/latest/device_memory_profiling.html
[6] https://massedcompute.com/faq-answers/?question=How+do+NVIDIA+GPUs+handle+memory+fragmentation+compared+to+TPUs%3F
[7] https://github.com/google/jax/issues/9064
[8] https://docs.jax.dev/en/latest/pallas/tpu/details.html
[9] https://app.studyraid.com/en/read/11969/381958/memory-management-best-practices