Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kuinka GPT-4.5: n suorituskyky verrataan GPT-4O: hon hallusinaatioiden suhteen


Kuinka GPT-4.5: n suorituskyky verrataan GPT-4O: hon hallusinaatioiden suhteen


GPT-4.5 ja GPT-4O ovat molemmat edistyneitä kielimalleja, jotka ovat kehittäneet OpenAi, jokaisella on selkeät parannukset edeltäjiinsä nähden. Kun verrataan niiden suorituskykyä hallusinaatioiden suhteen, GPT-4,5 osoittaa hallusinaatioasteen merkittävää vähenemistä GPT-4O: iin verrattuna.

Hallusinaation vähentäminen GPT-4.5: ssä

-Hallusinaationopeus: GPT-4,5: n hallusinaatioaste on noin 19%, kun sitä testataan PersonQA-tietojoukossa, mikä on huomattava parannus GPT-4O: n noin 52% [2] [5]. Tämä pelkistys osoittaa, että GPT-4.5 on luotettavampi ja vähemmän alttiita tiedon luomiseen, jota ei perustella tosiasiallisissa tiedoissa.
-Parannustekniikat: GPT-4.5: n hallusinaatioiden vähentyminen johtuu uusista valvontatekniikoista yhdistettynä perinteisiin menetelmiin, kuten valvottu hienosäätö (SFT) ja vahvistusoppiminen ihmisen palautteesta (RLHF) [1]. Nämä menetelmät auttavat parantamaan mallin tosiasiallista tarkkuutta ja luotettavuutta.

Suorituskykyvertailu

-Tarkkuus: Henkilökohtaisen tietojoukon tarkkuuden suhteen GPT-4,5 saavuttaa korkeamman tarkkuuden 78%verrattuna GPT-4O: n 28%: iin [2] [5]. Tämä viittaa siihen, että GPT-4.5-hallusinaatissa ei vain ole myös tarkempia vastauksia.
- Yleinen luotettavuus: GPT-4.5: n alempi hallusinaatioaste ja suurempi tarkkuus tekevät siitä luotettavamman valinnan sovelluksille, jotka vaativat tarkkaa ja luotettavaa tietoa. Molemmat mallit toimivat kuitenkin samalla tavalla tietyissä arvioinnissa, kuten oikeudenmukaisuuden ja puolueellisuuden arvioinnissa [5].

Yhteenvetona voidaan todeta, että GPT-4.5 ylittää GPT-4O: n hallusinaation vähentämisen ja tarkkuuden suhteen, mikä tekee siitä luotettavamman vaihtoehdon tehtäville, jotka vaativat tarkkoja ja tosiasiallisia tietoja. Molemmilla malleilla on kuitenkin vahvuudet ja heikkoudet eri alueilla ja arvioinnilla.

Viittaukset:
[1] https://toposads.com/openai-release-gpt-4-5/
[2] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-5_system_card_2272025.pdf
.
.
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
.
[7] https://mashable.com/article/openai-gpt-4-5-release-how-to-try
.