Berdasarkan hasil penelusuran, berikut perbandingan Claude 3.5 Sonnet dengan GPT-4 dalam hal akurasi pengkodean:
1. Kemahiran Pengkodean (HumanEval Benchmark):
- Claude 3.5 Soneta: Akurasi 92,0% (0 tembakan)
- GPT-4o: akurasi 90,2% (0 tembakan)
Hasil pencarian menunjukkan bahwa Claude 3.5 Sonnet mengungguli GPT-4o pada benchmark HumanEval, yang mengukur kemahiran pengkodean. Claude 3.5 Sonnet mencapai skor akurasi lebih tinggi yaitu 92,0% dibandingkan dengan GPT-4o yang 90,2%.
2. Evaluasi Pengkodean Agenik:
- Claude 3.5 Sonnet: Menyelesaikan 64% masalah
- Claude 3 Opus: Menyelesaikan 38% masalah
Dalam evaluasi pengkodean agen internal yang dilakukan oleh Anthropic, Claude 3.5 Sonnet mampu menyelesaikan 64% permasalahan, jauh mengungguli model Claude 3 Opus sebelumnya yang hanya menyelesaikan 38% permasalahan. Ini menunjukkan kemampuan pengkodean Claude 3.5 Sonnet yang lebih unggul dibandingkan model sebelumnya.
Hasil pencarian tidak memberikan perbandingan langsung antara Claude 3.5 Sonnet dan GPT-4 dalam hal evaluasi pengkodean agen. Namun, performa kuat Claude 3.5 Sonnet pada benchmark HumanEval dan evaluasi pengkodean agen internal menunjukkan bahwa kinerjanya kemungkinan mengungguli GPT-4 dalam hal akurasi pengkodean dan kemampuan pemecahan masalah.
Secara keseluruhan, hasil penelusuran menunjukkan bahwa Claude 3.5 Sonnet adalah model yang sangat mumpuni dalam hal tugas pengkodean, mengungguli GPT-4o dan model Claude sebelumnya dalam hal akurasi pengkodean dan pemecahan masalah.
Kutipan:[1] https://www.vellum.ai/blog/claude-3-5-sonnet-vs-gpt4o
[2] https://apidog.com/blog/claude-3-5-sonnet/
[3] https://cryptoslate.com/claude-3-5-sets-new-ai-benchmarks-beating-gpt-4o-in-coding-and-reasoning/
[4] https://www.trendlinenews.com/article/Claude-35-Sonnet-is-Leading-the-Way-in-AI-Performance-and-Versatility
[5] https://www.anthropic.com/news/claude-3-5-sonnet