Remiantis paieškos rezultatais, yra keletas pagrindinių dalykų, susijusių su prieiga prie „/tmp/tpu_logs“ katalogo „TensorFlow“ naudojant TPU:
1. Leidimai: „/tmp/tpu_logs“ katalogą „TensorFlow“ naudoja žurnalo failams, susijusiems su TPU naudojimu, saugoti. Šio katalogo leidimai turi būti tinkamai nustatyti, kad būtų suteikta prieiga. Tiksliau:
- Katalogas turi turėti 0666 leidimus (skaitymo ir rašymo prieiga visiems vartotojams), kad keli vartotojai galėtų pasiekti žurnalus.
- Jei katalogas priklauso konkrečiam vartotojui, kiti vartotojai gali neturėti prieigos prie žurnalų, nebent leidimai nustatyti tinkamai.
2. Užrakinimo failas: „TensorFlow“ naudoja užrakinimo failą („/tmp/libtpu_lockfile“), kad tvarkytų prieigą prie TPU. Šiam užrakto failui turi būti suteiktas 0666 leidimas, kad keli vartotojai galėtų pasiekti TPU.
3. Išvalymas: kai išjungiama „TensorFlow“ programa, naudojanti TPU, užrakto failas ir žurnalo failai gali būti netinkamai išvalyti. Dėl to gali kilti problemų bandant paleisti programą dar kartą, nes failai vis tiek gali būti naudojami.
Norėdami išspręsti iškilusią problemą, galite išbandyti šiuos veiksmus:
1. Įsitikinkite, kad katalogas „/tmp/tpu_logs“ turi tinkamus leidimus (pvz., „sudo chmod 0666 /tmp/tpu_logs“).
2. Patikrinkite, ar kataloge „/tmp/tpu_logs“ nėra užrakinimo failų arba žurnalo failų, ir, jei reikia, ištrinkite juos.
3. Pabandykite dar kartą paleisti TensorFlow kodą su TPU ir įsitikinkite, kad tinkamai išvalėte visus laikinus failus ar katalogus, kai programa išeina.
Išspręsdami leidimus ir išvalę katalogą „/tmp/tpu_logs“, turėtumėte sugebėti išspręsti problemas, su kuriomis susiduriate bandydami pasiekti TPU žurnalus.
Citatos:
[1] https://unix.stackexchange.com/questions/71622/what-are-correct-permissions-for-tmp-i-unintentionally-set-it-all-public-recu
[2] https://serverfault.com/questions/614781/php-script-cant-access-tmp-folder
[3] https://github.com/google/jax/issues/10192
[4] https://askubuntu.com/questions/1263843/how-to-allow-snap-applications-to-access-tmp-folder
[5] https://stackoverflow.com/questions/72735442/how-to-delete-a-temp-folder-in-google-cloud-tpu-vm
Kokie yra rekomenduojami /tmp/tpu_logs leidimai siekiant užtikrinti saugumą
Norėdami pašalinti TPU problemas „TensorFlow“, galite naudoti „TensorFlow“ integruotus registravimo įrankius. Štai keli žingsniai, kurie jums padės:
1. Įgalinti tikrinimo skaičius:
– Kodo pradžioje pridėkite „tf.debugging.enable_check_numerics()“.
– Tai padės aptikti bet kokias skaitines modelio problemas.
2. Įgalinti derinimo informaciją:
- Naudokite „tf.debugging.experimental.enable_dump_debug_info()“, kad gautumėte išsamią informaciją apie modelio vykdymą.
- Tai gali padėti nustatyti su TPU paskirstymu susijusias problemas.
3. Naudokite TensorBoard:
- Naudokite TensorBoard norėdami vizualizuoti ir derinti savo modelio našumą.
- Tai gali padėti nustatyti su TPU paskirstymu susijusias problemas.
4. Patikrinkite, ar nėra suderinamumo problemų:
- Įsitikinkite, kad jūsų TPU yra suderinamas su jūsų naudojama TensorFlow versija.
- Patikrinkite TensorFlow dokumentaciją, ar nėra žinomų problemų, susijusių su TPU paskirstymu.
5. Patikrinkite aparatinės įrangos suderinamumą:
- Įsitikinkite, kad jūsų aparatinė įranga yra suderinama su TPU.
- Patikrinkite TensorFlow dokumentaciją, ar nėra žinomų problemų, susijusių su aparatinės įrangos suderinamumu.
6. Patikrinkite API suderinamumą:
– Įsitikinkite, kad jūsų kodas yra suderinamas su TPU API.
- Patikrinkite TensorFlow dokumentaciją, ar nėra žinomų problemų, susijusių su API suderinamumu.
7. Patikrinkite, ar nėra žinomų problemų:
– Patikrinkite „TensorFlow GitHub“ problemų puslapį, ar nėra žinomų problemų, susijusių su TPU platinimu.
- Praneškite apie visas naujas iškilusias problemas.
Atlikdami šiuos veiksmus, turėtumėte sugebėti pašalinti ir išspręsti TPU paskirstymo problemas savo TensorFlow modelyje.
Citatos:[1] https://www.unix.com/aix/33449-set-permission-files-tmp.html
[2] https://forum.joomla.org/viewtopic.php?t=964269
[3] https://unix.stackexchange.com/questions/71622/what-are-correct-permissions-for-tmp-i-unintentionally-set-it-all-public-recu
[4] https://github.com/google/jax/issues/10192
[5] https://stackoverflow.com/questions/72735442/how-to-delete-a-temp-folder-in-google-cloud-tpu-vm