Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Hoe werkt de glijdende schaal in het model van Anthropic?


Hoe werkt de glijdende schaal in het model van Anthropic?


Anthropic maakt gebruik van een "verantwoord schaalbeleid" (RSP) om risico's te beheren die zijn gekoppeld aan steeds meer capabele AI -modellen [5]. Dit beleid maakt gebruik van een raamwerk genaamd AI Safety Niveaus (ASL), dat inspiratie haalt uit de normen van de bioveiligheidsniveau van de Amerikaanse overheid voor het omgaan met gevaarlijke biologische materialen [5]. Het ASL -framework is ontworpen om veiligheid, beveiliging en operationele normen te implementeren die geschikt zijn voor het potentieel van een model voor catastrofaal risico, met hogere ASL -niveaus die strengere demonstraties van veiligheid vereisen [5].

De beste huidige modellen van Anthropic zijn op ASL-2 [4]. Het bedrijf definieert insluitings- en implementatiemaatregelen voor ASL-2 en ASL-3, en het verbindt zich aan het definiëren van ASL-4 veiligheidsmaatregelen vóór het trainen van ASL-3-modellen [4]. ASL-1 verwijst naar systemen die geen zinvolle catastrofaal risico vormen [5].

Anthropic wordt ook geïnvesteerd in mechanistische interpreteerbaarheid, waarbij de interne werking van AI -systemen, met name diepe leermodellen, worden ontleden en begrijpen in een poging AI -gedrag voorspelbaarder en begrijpelijker te maken [5].

Citaten:
[1] https://www.prompthub.us/blog/using-anthropic-best-practices-parameters-and-large-context-windows
[2] https://www.techrepublic.com/article/anthropic-claude-large-language-model-research/
[3] https://aizi.substack.com/p/comments-on-anthropics-scaling-monosemanticiteit
[4] https://ailabwatch.org/companies/anthropic/
[5] https://klu.ai/glossary/antropic-ai
[6] https://help.promptitude.io/en/articles/8892919-underanding-antropic-models-a-simple-gids
[7] https://www.anthropic.com/news/anthropics-reaction-Scaling-policy
[8] https://www.lesswrong.com/posts/vaopgqhfpdjca8ceh/anthropic-reflections-on-ur-responsible-scaling-policy

Antwoord van perplexiteit: https://www.perplexity.ai/search/how-does-the-Sliding-Scale-fea-4flssmynqgibu47rvk8b7g?utm_source=copy_output