Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Hogyan működik a csúszó skála az antropikus modelljében


Hogyan működik a csúszó skála az antropikus modelljében


Antropikus egy "felelősségteljes méretezési politikát" (RSP) alkalmaz a kockázatok kezelésére az egyre képes AI modellekhez kapcsolódóan [5]. Ez a politika az AI Safety szint (ASL) nevű keretet használ, amely az Egyesült Államok kormányának biológiai biztonsági szintű szabványainak ihlette a veszélyes biológiai anyagok kezelésére vonatkozóan [5]. Az ASL -keretrendszer célja a biztonsági, biztonság és működési előírások végrehajtása, amelyek megfelelnek a modell katasztrofális kockázati lehetőségeinek, a magasabb ASL -szintek szigorúbb biztonság demonstrációját igénylik [5].

Az antropikus legjobb jelenlegi modelljei az ASL-2-nél vannak [4]. A társaság meghatározza az ASL-2 és az ASL-3 elszigetelési és telepítési intézkedéseit, és elkötelezi magát az ASL-4 biztonsági intézkedések meghatározására az ASL-3 modellek képzése előtt [4]. Az ASL-1 olyan rendszerekre utal, amelyek nem jelentenek értelmes katasztrofális kockázatot [5].

Az antropikus a mechanikus értelmezhetőségbe is befektet, amely magában foglalja az AI rendszerek, különösen a mély tanulási modellek belső működésének boncolását és megértését annak érdekében, hogy az AI viselkedés kiszámíthatóbbá és érthetőbbé váljon [5].

Idézetek:
[1] https://www.prompthub.us/blog/using-anthropic-best-practices-parameters-and-abge-centext-windows
[2] https://www.techrepublic.com/article/anthropic claude---ganguage-model-research/
[3] https://aizi.substack.com/p/comments-on-anthropics-scaling-monosemanticity
[4] https://ailabwatch.org/companies/anthropic/
[5] https://klu.ai/glossary/anthropic-ai
[6] https://help.prompptitude.io/en/articles/8892919-Eversting-anthropic-models-a-Simple-guide
[7] https://www.anthropic.com/news/anthropics-rescal-scaling-policy
[8] https://www.lesswrong.com/posts/vaopgqhfpdjca8ceh/anthropic-reflections-our-rescaling-policy-policy-

Válasz a zavarosságtól: https://www.perplexity.ai/search/how-does-the-sliding-scale-fea-4flssmynqgibu47rvk8b7g?utm_source=copy_output