Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon 滑动比例如何在人类模型工作中发挥作用


滑动比例如何在人类模型工作中发挥作用


Anthropic采用“负责任的缩放策略”(RSP)来管理与越来越有能力的AI模型相关的风险[5]。该政策使用一个称为AI安全水平(ASL)的框架,从美国政府的生物安全水平标准中汲取灵感来处理危险的生物材料[5]。 ASL框架旨在实施适合模型灾难性风险潜力的安全,保障和操作标准,其ASL水平较高需要更严格的安全证明[5]。

人类最佳当前模型在ASL-2 [4]。该公司定义了ASL-2和ASL-3的遏制和部署措施,并承诺在培训ASL-3模型之前定义ASL-4安全措施[4]。 ASL-1指的是没有造成有意义的灾难性风险的系统[5]。

拟人化还投入了机械性解释性,涉及解剖和理解AI系统的内部工作,尤其是深度学习模型,以使AI行为更可预测和可理解[5]。

引用:
[1] https://www.prompthub.us/blog/using-anththropic-best-practices-parameters-parameters-and-large-context-windows
[2] https://www.techrepublic.com/article/anthropic-claude-lange-lange-language-model-research/
[3] https://aizi.substack.com/p/comments-on-anththropics-scaling-monosmanticity
[4] https://ailabwatch.org/companies/anthropic/
[5] https://klu.ai/glossary/anthropic-ai
[6] https://help.promptitude.io/en/articles/8892919-Endercanding-anthropic-models-aimple-guide
[7] https://www.anthropic.com/news/anththropics-responsible-scaling-policy
[8] https://www.lesswrong.com/posts/vaopgqhfpdjca8ca8ceh/anthropic-reflections-on-on-our-our-responsible-scaling-policy-policy

答案来自困惑:https://www.perplexity.ai/search/how-does-the-sliding-sliding-scale-fea-4flssssmynqgibu47rvk8b7g?utm_source = copy_output