Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kakšne posebne aplikacije AI imajo največ koristi od SPARSECORE v TPU


Kakšne posebne aplikacije AI imajo največ koristi od SPARSECORE v TPU


Sparsekore v tenzorskih obdelavnih enotah (TPU) so še posebej koristne za aplikacije AI, ki se močno zanašajo na vdelave, kot so modeli priporočil za globoko učenje (DLRMS). Ti modeli se pogosto uporabljajo pri oglaševanju, uvrstitvi iskanja in platformah, kot je YouTube. Sparsecores pospešujejo obdelavo vdelave s preoblikovanjem velikih kategoričnih prostorov v manjše goste prostore, kar je ključnega pomena za priporočilne sisteme. Na primer, TPU V4 Sparsecores naredi 3-krat hitreje kot TPU V3 za priporočila in do 5-30x hitreje kot sistemi na osnovi CPU [1] [3].

Poleg tega so Sparsecores ugodni pri delovnih obremenitvah uvrstitve in naprednih priporočil, kjer so ultra velike vdelave pogoste. To je še izboljšano v novejših modelih TPU, kot je Trillium, ki integrirajo Sparsecores tretje generacije za optimizacijo zmogljivosti za te posebne naloge [7]. Na splošno lahko vsaka aplikacija AI, ki vključuje zapletene vdelave ali redke strukture podatkov, znatno koristi od zmogljivosti Sparsecores v TPU.

Navedbe:
[1] https://www.kdnuggets.com/2023/04/introducing-tpu-v4-googles-cutting-dupercomputer-Large-Language-models.html
[2] https://www.wevolver.com/article/tpu-vs-gpu-in-ai-a-compresion-guide-to-their-roles-and-impact-on-artificial-Inteligence
[3] https://www.vibranium.sg/post/introducing-tpu-v4-google-ssupercomputer-za-Large-Language-model
[4] https://www.datacamp.com/blog/tpu-vs-gpu-ai
[5] https://cloud.google.com/blog/products/ai-machine-learning/introducing-coloud-tpu-v5p-and-ai-hipercomputer
[6] https://eng.snap.com/training-models-with-tpus
[7] https://futurumgroup.com/insights/the-future-of-ai-infrastructure-unpacking-googles-trillium-tpus/
[8] https://www.zdnet.com/article/5-reasons-why-googles-trillium-could-transform-ai-and-cloud-computing-and-2-obstacles/
[9] https://cloud.google.com/tpu
[10] https://arxiv.org/pdf/2309.08918.pdf