Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Jak działa funkcja skali przesuwnej w modelu antropiku


Jak działa funkcja skali przesuwnej w modelu antropiku


Anthropic wykorzystuje „politykę odpowiedzialnego skalowania” (RSP) do zarządzania ryzykiem powiązanym z coraz bardziej zdolnymi modelami AI [5]. Niniejsza polityka wykorzystuje ramy o nazwie AI Bezpieczeństwo (ASL), czerpiąc inspirację ze standardów poziomu biologicznego rządu USA do obsługi niebezpiecznych materiałów biologicznych [5]. Ramy ASL mają na celu wdrażanie standardów bezpieczeństwa, bezpieczeństwa i operacji dostosowanych do potencjału modelu dla katastrofalnego ryzyka, przy czym wyższe poziomy ASL wymagają bardziej rygorystycznych demonstracji bezpieczeństwa [5].

Najlepsze obecne modele antropiku znajdują się w ASL-2 [4]. Firma definiuje środki ograniczenia i wdrażania dla ASL-2 i ASL-3 oraz zobowiązuje się do zdefiniowania środków bezpieczeństwa ASL-4 przed szkoleniem modeli ASL-3 [4]. ASL-1 odnosi się do systemów, które nie stanowią znaczącego katastrofalnego ryzyka [5].

Anthropiki jest również inwestowane w mechanistyczną interpretację, która obejmuje wyróżnienie i zrozumienie wewnętrznych działań systemów AI, szczególnie modeli głębokiego uczenia się, w celu uczynienia zachowania AI bardziej przewidywalnym i zrozumiałym [5].

Cytaty:
[1] https://www.pompthub.us/blog/using-antropic-best-practices-parameters-large-context-windows
[2] https://www.techrepublic.com/article/antropic-claude-large-language-model-research/
[3] https://aizi.substack.com/p/comments-on-antropics-scaling-monosemantyczność
[4] https://ailabwatch.org/companits/antropic/
[5] https://klu.ai/glossary/antropic-ai
[6] https://help.promptitude.io/en/articles/8892919-understanding-antropic-models-a-simple-guide
[7] https://www.antropic.com/news/Antropics-Responsible-Scaling-policy
[8] https://www.lesswrong.com/posts/vaopgqhfpdjca8ceh/anthropic-reflections-on-our-responsible-scaling-policy

Odpowiedź z zakłopotania: https://www.perplexity.ai/search/how-does-the-sliding-scale-fea-4flssmynqgibu47rvk8b7g?utm_source=copy_output_output_output