Kodēšanas precizitātes ziņā Claude 3.5 Sonnet atšķiras ar GPT-4

Pamatojoties uz meklēšanas rezultātiem, kodēšanas precizitātes ziņā Claude 3.5 Sonnet ir salīdzināts ar GPT-4:

1. Kodēšanas prasme (HumanEval etalons):
- Claude 3.5 Sonets: 92,0% precizitāte (0 šāviens)
- GPT-4o: 90,2% precizitāte (0 šāviens)

Meklēšanas rezultāti liecina, ka Claude 3.5 Sonnet pārspēj GPT-4o HumanEval etalonā, kas mēra kodēšanas prasmes. Claude 3.5 Sonnet sasniedza augstāku precizitātes rādītāju par 92,0%, salīdzinot ar GPT-4o 90,2%.

2. Aģentiskās kodēšanas novērtējums:
- Claude 3.5 Sonets: Atrisināja 64% problēmu
- Claude 3 Opus: Atrisināja 38% problēmu

Iekšējā aģentu kodēšanas novērtējumā, ko veica Anthropic, Claude 3.5 Sonnet spēja atrisināt 64% problēmu, ievērojami pārspējot iepriekšējo Claude 3 Opus modeli, kas atrisināja tikai 38% problēmu. Tas parāda Claude 3.5 Sonnet izcilās kodēšanas iespējas salīdzinājumā ar iepriekšējiem modeļiem.

Meklēšanas rezultāti nesniedz tiešu salīdzinājumu starp Claude 3.5 Sonnet un GPT-4 aģentu kodēšanas novērtējuma ziņā. Tomēr Claude 3.5 Sonnet spēcīgais sniegums HumanEval etalonā un iekšējā aģentu kodēšanas novērtējums liecina, ka tas, iespējams, pārspēj GPT-4 kodēšanas precizitātes un problēmu risināšanas spēju ziņā.

Kopumā meklēšanas rezultāti liecina, ka Claude 3.5 Sonnet ir ļoti spējīgs modelis, kad runa ir par kodēšanas uzdevumiem, kodēšanas precizitātes un problēmu risināšanas ziņā pārspējot GPT-4o un iepriekšējos Claude modeļus.

Citāts:
[1] https://www.vellum.ai/blog/claude-3-5-sonnet-vs-gpt4o
[2] https://apidog.com/blog/claude-3-5-sonnet/
[3] https://cryptoslate.com/claude-3-5-sets-new-ai-benchmarks-beating-gpt-4o-in-coding-and-reasoning/
[4] https://www.trendlinenews.com/article/Claude-35-Sonnet-is-Leading-the-Way-in-AI-Performance-and-Versatility
[5] https://www.anthropic.com/news/claude-3-5-sonnet