Trampas comunes cuando se usa antorch.compile en Pytorch

¿Cuáles son las trampas comunes al usar torch.compile?

Cuando se usa `torch.compile`, pueden surgir varias trampas comunes:

1. Variabilidad del rendimiento: `Torch.compile` no siempre mejora el rendimiento y, a veces, puede dar como resultado una ejecución más lenta o un mayor uso de la memoria. Es crucial comparar el rendimiento del modelo compilado con el modelo original [2] [4].

2. Breaks de gráficos: si `Torch.compile` encuentra código no compatible o operaciones complejas, puede introducir" rupturas de gráficos ", dividiendo el código en piezas optimizadas y no optimizadas. Si bien no son fatales, estos descansos pueden limitar los beneficios de optimización. Reescribir secciones problemáticas puede ayudar [2] [4].

3. Mensajes de error crípticos: las fallas de compilación a menudo producen mensajes de error crípticos que son difíciles de depurar sin ayuda del equipo de Pytorch. Esto puede hacer que la resolución de problemas sea desafiante [2] [4].

4. Tiempos de compilación largos: el proceso de compilación en sí puede llevar mucho tiempo, a veces tardando varios minutos o incluso más para modelos más grandes. Esto hace que sea aconsejable evaluar `antorch.compile` hacia el final del desarrollo en lugar de durante las etapas iniciales [1] [4].

5. Formas dinámicas y recompilación: `Torch.compile` inicialmente asume formas de tensor estático. Si las formas cambian, la recompilación puede ocurrir a menos que las formas dinámicas estén habilitadas. Esto puede conducir a ejecuciones iniciales más lentas debido a la recompilación [1].

6. Problemas de lectura múltiple: actualmente, la lectura múltiple con 'Torch.compile` es Buggy, que puede limitar su uso en entornos concurrentes [3].

7. Características no compatibles: algunas características numpy o operaciones complejas pueden no ser compatibles con 'Torch.compile`, lo que lleva a problemas de compilación o saltos de gráficos [5].

Para mitigar estos problemas, se recomienda aplicar `torch.compile` a funciones de alto nivel, usar formas dinámicas cuando sea necesario y probar a fondo el rendimiento del modelo compilado en comparación con el original [1] [2].

Citas:
[1] https://pytorch.org/docs/stable/torch.compiler_troublashooting.html
[2] https://lightning.ai/docs/fabric/2.2.3/advanced/compile.html
[3] http://blog.ezyang.com/2024/11/ways-to-use-torch-compile/
[4] https://lightning.ai/docs/pytorch/stable/advanced/compile.html
[5] https://pytorch.org/docs/stable/torch.compiler_faq.html
[6] https://stackoverflow.com/questions/75886125/how-should-i-use-torch-compile-properly
[7] https://www.aionlinecourse.com/blog/how-should-i-use-torch-compile-properly
[8] https://github.com/patrick-kidger/jaxtyping/issues/196