Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Como a escala deslizante aparece no modelo de Anthropic funciona


Como a escala deslizante aparece no modelo de Anthropic funciona


Antrópico emprega uma "política de escala responsável" (RSP) para gerenciar riscos vinculados a modelos de IA cada vez mais capazes [5]. Essa política usa uma estrutura chamada AI Níveis de Segurança (ASL), inspirando -se nos padrões de nível de biossegurança do governo dos EUA para lidar com materiais biológicos perigosos [5]. A estrutura ASL foi projetada para implementar padrões de segurança, segurança e operacionais adequados ao potencial de um modelo de risco catastrófico, com níveis mais altos de ASL exigindo demonstrações mais rigorosas de segurança [5].

Os melhores modelos atuais da Antrópica estão em ASL-2 [4]. A Companhia define medidas de contenção e implantação para ASL-2 e ASL-3 e se compromete a definir medidas de segurança ASL-4 antes de treinar os modelos ASL-3 [4]. ASL-1 refere-se a sistemas que não representam risco catastrófico significativo [5].

O antrópico também é investido em interpretabilidade mecanicista, que envolve dissecar e entender o funcionamento interno dos sistemas de IA, particularmente modelos de aprendizado profundo, em um esforço para tornar o comportamento da IA ​​mais previsível e compreensível [5].

Citações:
[1] https://www.prompthub.us/blog/using-anthropic-best-practices-parameters-and-large-Context-Windows
[2] https://www.techrepublic.com/article/antrópica-claude-large-language-model-research/
[3] https://aizi.substack.com/p/comments-on-anthropics-scaling-monsemanticity
[4] https://ailabwatch.org/companies/anthrópico/
[5] https://klu.ai/glossary/antrópico-ai
[6] https://help.promptitude.io/en/articles/8892919-undestanding-anthropic-models-a-simple-guide
[7] https://www.anthropic.com/news/anthropics-sponsible-scaling-policy
[8] https://www.lesswrong.com/postss/vaopgqhfpdjca8ceh/antrópica-reflections-on-our-sponsible-scaling-policy

Resposta de Perplexity: https://www.perplexity.ai/search/how-does-the-sliding-scale-fea-4flssmynqgibu47rvk8b7g?utm_source=copy_output