Comparando os custos do Google Cloud TPUs versus possuir hardware TPU

Como o custo das TPUs no Google Cloud se compara à compra e manutenção de seu próprio hardware TPU

Comparando o custo do uso do Google Cloud TPUs para comprar e manter seu próprio hardware TPU envolve vários fatores:

1. Custos de TPU em nuvem: O Google Cloud TPUS está disponível como um serviço em nuvem, o que significa que você paga apenas pelo tempo que os usa. O custo varia de acordo com a versão da TPU e o compromisso de uso. Por exemplo, um POD TPU V2 de 512 núcleos custa US $ 384 por hora sob demanda, com descontos significativos para compromissos de longo prazo-US $ 2,1 milhões por ano por um compromisso de um ano e US $ 4,5 milhões por três anos [1]. O mais recente TPU V4 pode custar aproximadamente US $ 8 por hora por chip e configurações em larga escala, como um TPU V4-POD, podem atingir US $ 32.200 por hora [2] [3].

2. Compra e manutenção de hardware próprio: as TPUs não são vendidas individualmente para uso pessoal; Eles estão disponíveis apenas em serviços em nuvem como o Google Cloud. No entanto, você pode comparar isso com a compra de GPUs de alto desempenho, que são comumente usadas para tarefas semelhantes. As GPUs de ponta como o NVIDIA V100 ou A100 podem custar entre US $ 8.000 e US $ 15.000 por unidade [2]. Além disso, a manutenção de seu próprio hardware envolve custos contínuos significativos de energia, resfriamento, sobrecarga e pessoal [7].

3. Considerações de custo: Para uso frequente ou contínuo, a compra e a manutenção de seu próprio hardware pode ser mais econômico a longo prazo, especialmente ao considerar o custo total de propriedade, incluindo despesas operacionais. No entanto, para projetos ocasionais ou em pequena escala, serviços em nuvem como o Google Cloud TPUs podem ser mais econômicos devido à falta de custos iniciais de capital e à capacidade de escalar conforme necessário [7].

Em resumo, enquanto a Cloud TPUs oferece flexibilidade e escalabilidade sem custos iniciais de hardware, a compra e a manutenção de seu próprio hardware (como GPUs de alto desempenho) pode ser mais econômico para uso intensivo de longo prazo, considerando as despesas iniciais e operacionais.

Citações:
[1] https://www.reddit.com/r/machinelearning/comments/epx5vg/d_googleg_cloud_tpu_pod_pricing_grid_a_512core_tpu/
[2] https://www.datacamp.com/blog/tpu-vs-gpu-ai
[3] https://www.chaotropy.com/why-googles-tpus-are-no-match-for-nvidias-gpus/
[4] https://www.androidpolice.com/what-are-google-coud-tpus/
[5] https://cloud.google.com/tpu
[6] https://www.syntio.net/en/labs-musings/machine-learning-on-gcp-cloud-tpu-vs-loud-functions/
[7] https://www.dataknobs.com/generativeai/tpu/tpu-gpu-cost.html
[8] https://cloud.google.com/tpu/docs/intro-to-tpu
[9] https://cloudplatform.googleblog.com/2018/06/cloud-tpu-now-espers-preemptible-pricing-and-global-availability.html