Distributionsprocessen skiljer sig avsevärt när man använder en privat S3 -hink kontra det kramande ansiktsnavet, främst när det gäller tillgänglighet, säkerhet och latens.
Distribution med hjälp av det kramande ansiktsnavet
Att distribuera modeller direkt från det kramande ansiktsnavet innebär att komma åt modeller via internet. Så här fungerar det vanligtvis:
1. Modellval: Du väljer önskad modell från det kramande ansiktsnavet, som är värd för ett brett utbud av förutbildade modeller.
2. Distributionskonfiguration: Du konfigurerar din distributionsmiljö, till exempel att välja lämplig instansstyp och ställa in nödvändig infrastruktur (t.ex. Azure Machine Learning eller Amazon Sagemaker).
3. Modellnedladdning: Under distributionen laddas modellen ner från det kramande ansiktsnavet till din distributionsmiljö. Detta steg kan introducera latens och kräver internetanslutning.
4. Säkerhetsöverväganden: Eftersom modeller nås via internet kan det finnas säkerhetsproblem relaterade till datasekretess och efterlevnad.
Distribution med en privat S3 -hink
Att distribuera modeller från en privat S3 -hink erbjuder förbättrad säkerhet och kontroll över distributionsprocessen:
1. Modellförberedelse: Du laddar först ner modellvikterna från det kramande ansiktsnavet och laddar upp dem till din privata S3 -hink. Detta steg möjliggör sårbarhetssökningar och säkerställer att modellen lagras säkert inom ditt AWS -konto.
2. Distribueringskonfiguration: Du konfigurerar din distributionsmiljö som liknar att använda det kramande ansiktsnavet, men du anger S3 -hinken som modellkällan.
3. Modellåtervinning: Under distributionen hämtas modellen från din S3 -hink, vilket minskar latensen eftersom modellen lagras närmare din distributionsmiljö (t.ex. Amazon Sagemaker).
4. Säkerhet och efterlevnad: Detta tillvägagångssätt förbättrar säkerheten genom att hålla modellvikter inom ditt AWS -konto, vilket möjliggör bättre kontroll över tillgång och efterlevnad av organisationspolicyer.
Sammanfattningsvis ger en privat S3 -hink mer kontroll över modelllagring och distribution, förbättrar säkerheten och minskar latensen jämfört med att distribuera direkt från det kramande ansiktsnavet. Det kräver emellertid ytterligare steg för att ladda upp modeller till S3 -hinken före distributionen [3].
Citeringar:
[1] https://support.atlassian.com/bitbucket-cloud/docs/deploy-to-aws-with-s3/
]
]
[4] https://docs.travis-ci.com/user/deployment/s3/
]
[6] https://huggingface.co/blog/introducing-private-hub
[7] https://www.edstem.com/blog/deploying-ring-app-s3-cloudfront/
[8] https://huggingface.co/blog/alvarobartt/deploy-from-hub-to-vertex-ai
]