Antropiline kasutab põhiseaduslikku AI -d ja kahjutu koolitust, et tagada selle AI mudelid, ausad ja kahjutud [3]. Selle lähenemisviisi eesmärk on vähendada brändiriski ja tagab AI -süsteemi usaldusväärse, tõlgendatava ja juhitava [3]. Anthropici mudelid on loodud suures koguses tekstiandmeid, mõistmist ja koodi genereerimist, muutes need kasulikuks tarkvaraarendusülesanneteks ja muude rakenduste jaoks, näiteks klienditeenindus ja juriidiline kodeerimine [3].
Võrreldes traditsiooniliste suurte keelemudelitega, on peamised erinevused antropilise lähenemise mõttekäigule:
* Keskenduge AI ohutusele: antropiline on pühendatud usaldusväärsete ja tõlgendatavate AI -süsteemide loomisele, mis vastavad inimlikele väärtustele ja ohutusstandarditele [2]. Ettevõte keskendub AI -ga seotud riskide mõistmisele ja leevendamisele looduslike keele töötlemise, inimese tagasiside ja tõlgendatavuse uurimise kaudu [2].
* Põhiseaduslik AI: antropiline kasutab põhiseaduslikku AI -d, õpetades oma mudeleid õige ja vale vahel [7]. See uudne lähenemisviis on ülioluline, kuna keelemudelid muutuvad üha enam faktide ja tõe allikateks [7].
* Tõlgendatavad omadused: Anthropicu teadlased eraldavad tõlgendatavaid tunnuseid suurtest keelemudelitest nagu Claude 3, tõlkides need inimlik mõistetavateks mõisteteks [4]. Need tõlgendatavad omadused võivad kehtida sama kontseptsiooni kohta erinevates keeltes ning nii piltide kui ka teksti kohta [4].
* LLMS -i mõistuse kaardistamine: Antropiline on teinud samme suurte keelemudelite (LLM -ide) sisemise töö dešifreerimisel, kasutades sõnaraamatu õppimist miljonite funktsioonide kaardistamiseks nende AI -mudelis Claude Sonnet [2]. See suurendab AI ohutust ja tõlgendatavust, pakkudes AI teabe töötlemise sügavamat mõistmist [2]. Nende omadustega manipuleerides võib antropiline muuta Claude'i vastuseid, näidates otsest põhjuslikku seost neuronite aktiveerimiste ja mudeli väljundi vahel, mis võib AI käitumist täpsustada, et parandada ohutust ja jõudlust [2].
* Antropilised mõttekäigud: antropilised mõttekäigud arvavad, et vaatlejate olemasolu seab piirangud universumi omadustele [1]. Nõrk antropiline põhimõte (WAP) viitab sellele, et saaksime jälgida ainult neid universumi aspekte, mis on meie olemasoluga vaatlejatena ühilduvad [1]. Tugev antropiline põhimõte (SAP) väidab, et universumi seadused ja konstandid on üles ehitatud nii, et elu oleks vältimatu [1]. Antropiline arutluskäik rõhutab meie tähelepanekute loomulikku valiku eelarvamusi ja annab ülevaate universumi peenhäälestamise ja teadusliku uurimise piirangute kohta [1].
Tsitaadid:
]
[2] https://theaitrack.com/anthropic-mapping-the-mind-of-b-manguage-models/
]
]
]
]
]
]