Antropisk bruker konstitusjonell AI og ufarlig trening for å sikre at AI -modellene er nyttige, ærlige og ufarlige [3]. Denne tilnærmingen tar sikte på å redusere merkevareisikoen og sikrer at AI -systemet er pålitelig, tolkbar og styrbart [3]. Anthropics modeller er designet for å behandle store mengder tekstdata, forstå og generere kode, noe som gjør dem nyttige for programvareutviklingsoppgaver og andre applikasjoner som kundeservice og lovlig koding [3].
Sentrale forskjeller i antropisk tilnærming til resonnement, sammenlignet med tradisjonelle store språkmodeller, inkluderer:
* Fokus på AI -sikkerhet: Antropisk er dedikert til å skape pålitelige og tolkbare AI -systemer som samsvarer med menneskelige verdier og sikkerhetsstandarder [2]. Selskapet fokuserer på å forstå og avbøte risikoer forbundet med AI gjennom forskning innen naturlig språkbehandling, menneskelig tilbakemelding og tolkbarhet [2].
* Constitutional AI: Antropisk benytter konstitusjonell AI, og lærer modellene forskjellen mellom rett og galt [7]. Denne nye tilnærmingen er avgjørende ettersom språkmodeller i økende grad blir kilder til fakta og sannhet [7].
* Tolkbare funksjoner: Anthropics forskere trekker ut tolkbare funksjoner fra store språkmodeller som Claude 3, og oversetter dem til menneskelige forståelige konsepter [4]. Disse tolkbare funksjonene kan gjelde for samme konsept på forskjellige språk og både på bilder og tekst [4].
* Kartlegging av LLMS -sinnet: Antropisk har gjort fremskritt i å dechiffrere de indre virkningene av store språkmodeller (LLMS) ved å bruke ordboks læring for å kartlegge millioner av funksjoner i deres AI -modell, Claude Sonnet [2]. Dette forbedrer AI -sikkerhet og tolkbarhet, og gir en dypere forståelse av hvordan AI behandler informasjon [2]. Ved å manipulere disse funksjonene, kan antropisk endre Claude's svar, og demonstrere en direkte årsakssammenheng mellom neuronaktiveringer og modellens produksjon, som kan finjustere AI-atferd for å forbedre sikkerhet og ytelse [2].
* Antropisk resonnement: Antropisk resonnement antyder at eksistensen av observatører pålegger begrensningene til universets egenskaper [1]. Det svake antropiske prinsippet (WAP) antyder at vi bare kan observere de aspektene av universet som er kompatible med vår eksistens som observatører [1]. Det sterke antropiske prinsippet (SAP) foreslår at universets lover og konstanter er strukturert slik at livet er uunngåelig [1]. Antropisk resonnement understreker den iboende seleksjonsskjevheten i våre observasjoner og gir innsikt i finjustering av universet og begrensningene for vitenskapelig undersøkelse [1].
Sitasjoner:
[1] https://newspaceeconomy.ca/2024/11/23/the-role-of-antropic-reasoning-in-forståelse-the-universe/
[2] https://theaitrack.com/antropic-mapping-the-mind-of-large-fanguage-models/
[3] https://help.promptitude.io/no/articles/8892919-forstanding-antropic-odels-a-simple-guide
[4] https://www.techrepublic.com/article/anthropic-claude-large-anguage-model-research/
[5] https://risingentropy.com/in-favor-of-antropic-reasoning/
[6] https://www.antropic.com/research/mapping-mind-anguage-modell
[7] https://www.marketingaiinstitute.com/blog/anthropic-claude-constitutional-ai
[8] https://www.activeloop.ai/resources/how-to-compare-large-fanguage-models-gpt-4-3-5-vs-anthropic-claude-vs-cohere/