Antrópico utiliza a IA constitucional e o treinamento de inovação para garantir que seus modelos de IA sejam úteis, honestos e inofensivos [3]. Essa abordagem visa reduzir o risco de marca e garante que o sistema de IA seja confiável, interpretável e orientável [3]. Os modelos da Anthropic são projetados para processar grandes quantidades de dados de texto, entender e gerar código, tornando -os úteis para tarefas de desenvolvimento de software e outros aplicativos, como atendimento ao cliente e codificação legal [3].
As principais diferenças na abordagem do raciocínio antropal, em comparação com os modelos de idiomas grandes tradicionais, incluem:
* Concentre -se na segurança da IA: o antrópico é dedicado a criar sistemas de IA confiáveis e interpretáveis que se alinham aos valores humanos e padrões de segurança [2]. A empresa se concentra na compreensão e mitigação de riscos associados à IA por meio de pesquisas em processamento de linguagem natural, feedback humano e interpretabilidade [2].
* AI constitucional: Antrópico emprega IA constitucional, ensinando seus modelos a diferença entre certo e errado [7]. Essa nova abordagem é crucial à medida que os modelos de linguagem se tornam cada vez mais fontes de fatos e verdade [7].
* Recursos interpretáveis: os pesquisadores da Antrópica extraem características interpretáveis de grandes modelos de idiomas como Claude 3, traduzindo-os em conceitos humanos-entendidos [4]. Esses recursos interpretáveis podem se aplicar ao mesmo conceito em diferentes idiomas e a imagens e texto [4].
* Mapeando a mente do LLMS: o antropic fez progressos ao decifrar o funcionamento interno de grandes modelos de linguagem (LLMS) usando o aprendizado do dicionário para mapear milhões de recursos em seu modelo de IA, Sonnet Claude [2]. Isso aprimora a segurança e a interpretabilidade da IA, oferecendo uma compreensão mais profunda de como a IA processa as informações [2]. Ao manipular essas características, o antrópico pode alterar as respostas de Claude, demonstrando uma relação causal direta entre as ativações dos neurônios e a saída do modelo, que pode ajustar o comportamento da IA para melhorar a segurança e o desempenho [2].
* Raciocínio antrópico: O raciocínio antrópico postula que a existência de observadores impõe restrições às características do universo [1]. O fraco princípio antrópico (WAP) sugere que podemos observar apenas os aspectos do universo que são compatíveis com nossa existência como observadores [1]. O forte princípio antrópico (SAP) propõe que as leis e constantes do universo sejam estruturadas para que a vida seja inevitável [1]. O raciocínio antrópico enfatiza o viés de seleção inerente em nossas observações e fornece informações sobre o ajuste fino do universo e as restrições sobre a investigação científica [1].
Citações:
[1] https://newspaceeconomy.ca/2024/11/23/the-role-of-anthropic-reasoning-in-understand-the-universe/
[2] https://theaitrack.com/antrópica-mapping-the-mind-of-large-language-models/
[3] https://help.promptitude.io/en/articles/8892919-undestanding-anthropic-models-a-simple-guide
[4] https://www.techrepublic.com/article/antrópica-claude-large-language-model-research/
[5] https://risingentropy.com/in-favor-of-anthropic---reonomening/
[6] https://www.anthropic.com/research/mapping-mind-language-model
[7] https://www.marketingaiinstitute.com/blog/antrópica-claude-constitucional-ai
[8] https://www.activeloop.ai/resources/how-to-compare-large-language-models-gpt-4-3-5-vs-antrópico-claude-vs-cohere/