Deepseek-R1 dan COHERE's Command R (Agustus 2024) keduanya model bahasa canggih, tetapi mereka menunjukkan perbedaan yang berbeda dalam kinerja, arsitektur, dan harga.
Arsitektur dan Pelatihan:
-Deepseek-R1 adalah model campuran 671 miliar parameter (MOE), dengan 37 miliar parameter teraktivasi per token. Itu dilatih menggunakan pembelajaran penguatan skala besar, dengan fokus pada kemampuan penalaran. Model ini menggabungkan dua tahap pembelajaran penguatan dan dua tahap fine-tuning yang diawasi untuk meningkatkan kemampuan penalaran dan tidak masuk akal [1] [3].
- Command R (Agustus 2024), dikembangkan oleh cohere, fitur peningkatan generasi multibahasa pengambilan multibahasa (RAG) dan kemampuan penggunaan alat. Ini unggul dalam tugas matematika, kode, dan penalaran, memberikan hasil yang sebanding dengan pendahulunya, perintah R+[1] [3].
tolok ukur kinerja:
- Deepseek-R1 melakukan sebanding dengan model O1 Openai di banyak tolok ukur penalaran, termasuk tugas matematika dan kode. Ini unggul dalam tugas-tugas kreatif dan konteks panjang seperti Alpacaeval 2.0 dan Arenahard, mengungguli model lain di bidang ini [2]. Deepseek-R1 mencetak 90,8% pada patokan MMLU dan 84% pada MMLU-Pro, menunjukkan kemampuan penalaran yang kuat [1].
- Command R (Agustus 2024) mencapai skor 67% pada patokan MMLU dan 70% pada humaneval, menunjukkan kinerja yang solid dalam pembuatan kode dan pemecahan masalah [1]. Namun, kinerjanya pada MMLU-Pro dan tolok ukur penalaran khusus lainnya tidak dilaporkan.
Harga dan Biaya:
- Deepseek-R1 secara signifikan lebih mahal daripada Komando R (Agustus 2024), dengan biaya input pada $ 0,55 per juta token dan biaya output pada $ 2,19 per juta token. Ini membuatnya kira -kira 3,7 kali lebih mahal untuk token input dan output [1] [3].
- Command R (Agustus 2024) menawarkan biaya yang lebih rendah, dengan token input dengan harga $ 0,15 per juta dan token output pada $ 0,60 per juta [1] [4].
Open-Source and Community:
-Deepseek-R1 adalah sumber terbuka, memungkinkan untuk perbaikan dan modifikasi yang didorong oleh masyarakat. Keterbukaan ini dapat menyebabkan kemungkinan pengembangan dan kustomisasi yang lebih transparan [1] [5].
- Komando R (Agustus 2024) bukan open-source, membatasi keterlibatan masyarakat dalam pengembangan dan penyesuaiannya [1].
Sensitivitas yang cepat:
-Deepseek-R1 sensitif terhadap petunjuk, dengan beberapa penembakan yang sering degradasi kinerjanya. Disarankan untuk menggunakan nol-tembakan yang diminta dengan instruksi yang jelas untuk hasil yang optimal [2].
- Tidak ada penyebutan spesifik tentang sensitivitas cepat untuk perintah r (Agustus 2024) dalam informasi yang tersedia.
Singkatnya, sementara kedua model memiliki kemampuan penalaran yang kuat, Deepseek-R1 unggul dalam tolok ukur tertentu dan menawarkan fleksibilitas sumber terbuka, tetapi dengan biaya yang lebih tinggi. Perintah R (Agustus 2024) lebih hemat biaya dan memberikan kinerja kompetitif di bidang-bidang tertentu seperti pembuatan kode.
Kutipan:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-oveview-and-how-it-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artitifialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artitifialanalysis.ai/models
[7] https://artitifialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms