Antropic uporablja ustavni AI in neškodljivo usposabljanje, da zagotovi, da so njeni modeli AI koristni, pošteni in neškodljivi [3]. Cilj tega pristopa je zmanjšati tveganje blagovne znamke in zagotoviti, da je sistem AI zanesljiv, interpretacija in vodila [3]. Antropični modeli so zasnovani tako, da obdelujejo velike količine besedilnih podatkov, razumevanje in ustvarjanje kode, zaradi česar so uporabne za naloge za razvoj programske opreme in druge aplikacije, kot sta služba za stranke in pravno kodiranje [3].
Ključne razlike v antropičnem pristopu k sklepanju v primerjavi s tradicionalnimi velikimi jezikovnimi modeli vključujejo:
* Osredotočenost na varnost AI: Antropic je namenjen ustvarjanju zanesljivih in razlagalnih sistemov AI, ki se uskladijo s človeškimi vrednotami in varnostnimi standardi [2]. Podjetje se osredotoča na razumevanje in ublažitev tveganj, povezanih z AI, z raziskavami na področju obdelave naravnega jezika, človeških povratnih informacij in interpretabilnosti [2].
* Ustavni AI: Antropic uporablja ustavni AI in svoje modele uči razlike med pravim in napačnim [7]. Ta nov pristop je ključnega pomena, saj jezikovni modeli vse bolj postanejo viri dejstev in resnice [7].
* Interpretabilne značilnosti: Antropic-ovi raziskovalci izvlečejo interpretacijske značilnosti iz velikih jezikovnih modelov, kot je Claude 3, in jih prevajajo v koncepte, ki razumljivi pri človeku [4]. Te razlagalne funkcije lahko veljajo za isti koncept v različnih jezikih in tako za slike kot za besedilo [4].
* Kartiranje uma LLM: Antropic je močno napredoval pri dešifriranju notranjega delovanja velikih jezikovnih modelov (LLM) z uporabo slovarskega učenja za preslikavo milijonov funkcij v njihovem modelu AI, Claude Sonnet [2]. To povečuje varnost in razlago AI, kar ponuja globlje razumevanje, kako AI obdeluje informacije [2]. Z manipulacijo s temi značilnostmi lahko antropični spremeni Claudejeve odzive, kar kaže na neposredno vzročno zvezo med aktivacijami nevronov in izhodom modela, ki lahko natančno prilagodi vedenje AI za izboljšanje varnosti in zmogljivosti [2].
* Antropično sklepanje: Antropično sklepanje predstavlja, da obstoj opazovalcev nalaga omejitve glede značilnosti vesolja [1]. Šibko antropsko načelo (WAP) nakazuje, da lahko opazujemo samo tiste vidike vesolja, ki so združljivi z našim obstojem kot opazovalci [1]. Močno antropsko načelo (SAP) predlaga, da so zakoni in konstante vesolja strukturirani tako, da je življenje neizogibno [1]. Antropsko sklepanje poudarja inherentno izbirno pristranskost v naših opazovanjih in daje vpogled v natančno nastavitev vesolja in omejitve znanstvenega raziskovanja [1].
Navedbe:
[1] https://newspaceeconomy.ca/2024/11/23/the-role-of-anthropic-reasoning-in-randergening-the-universe/
[2] https://theaitrack.com/anthropic-caping-the-mind-of-large-language-models/
[3] https://help.promptitude.io/sl/articles/8892919- medsebojno razumevanje-anthropc-models-a-Simple-Guide
[4] https://www.techrepublic.com/article/anthropic-claude-large-language-model-research/
[5] https://risingentropy.com/in-barot-of-anthropic-reasoning/
[6] https://www.anthropic.com/research/Mapping-mind-language-model
[7] https://www.marketingaiinstitute.com/blog/anthropic-claude-constitutional-ai
[8] https://www.activeloop.ai/resources/how-to-compare-large-language-models-gpt-4-3-5-vs-anthropic-claude-vs-cohere/