Bežná inferencia Deepseek na vzduchu M4 MacBook Air zahŕňa pochopenie schopností kremíka Apple a špecifické požiadavky modelov Deepseek. Tu je zrútenie toho, čo potrebujete vedieť:
Prehľad modelov Deepseek
-DeepSEek-V3: Tento model je model veľkej zmesi expertov (MOE) s 671 miliardami parametrov. Úspešne spustil klaster M4 MAC Minis, ktorý predstavuje účinnosť kremíka Apple pre veľké jazykové modely [1].
- Deepseek R1: Vydaný v januári 2025, tento model je otvoreným zdrojom a súpermi GPT modely. Ponúka rôzne kvantifikované verzie na zníženie požiadaviek na veľkosť a hardvér, vďaka čomu je uskutočniteľnejšia pre miestne nasadenie na zariadeniach, ako je M4 MacBook Air [2].
Running Deepseek na M4 MacBook Air
Kľúčové úvahy
1. Pamäť a veľkosť modelu: Vzduch M4 MacBook sa zvyčajne dodáva s menším počtom RAM v porovnaní s mini klastrom M4 MAC používaným pre DeepSeek-V3. Budete musieť vybrať menšiu alebo kvantifikovanú verziu modelu Deepseek, aby sa zmestila do dostupného RAM [2].
2. Architektúra zjednotenej pamäte: Architektúra zjednotenej pamäte spoločnosti Apple Silicon je prospešná pre efektívne prevádzkovanie veľkých modelov, najmä pri vytváraní odpovedí jeden po druhom [1].
3. Kvantizácia a výber modelu: Na spustenie vzduchu M4 MacBook Air by ste mohli zvážiť kvantifikované verzie DeepSeek R1, ako je model 14B, ktorý môže bežať s niektorými RAM, aby sa ušetril [2].
Kroky na lokálne spúšťajú Deepseek
1. Nainštalujte Ollama: Použite Ollama na správu miestnych LLM na vašom MacBook Air. Umožňuje vám inštalovať a prevádzkovať rôzne modely vrátane Deepseek [2].
2. Vyberte model: Vyberte kvantifikovanú verziu DeepSeek R1, ktorá sa zmestí do pamäte RAM MacBook Air. Modely ako Deepseek-R1-Distill-Qwen-14b sú vhodné možnosti [2].
3. Spustite model: Na spustenie modelu s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou s kvantizáciou je použitie modelu: Príkazy ako „Exo Run DeepSeek-R1-M4-MAX.
Záver
Spustenie inferencie DeepSeek na vzduchu M4 MacBook Air je možné pri výbere a kvantizácii správneho modelu. Architektúra zjednotenej pamäte kremíka Apple poskytuje výkonnostnú výhodu, najmä pre scenáre generácie jednej reakcie. Obmedzený RAM v porovnaní s nastaveniami servera však znamená, že sa budete musieť zvoliť pre menšie alebo kvantifikované modely, aby ste zaistili plynulú prevádzku.
Citácie:[1] https://digialps.com/deepseek-v3-on-m4-mac-blazing-fast-inference-on-apple-silicon/
[2] https://abedt.com/blog/running-deepseek-on-an-m4-pro-macbook/
[3] https://www.reddit.com/r/localllama/comments/1hne97k/Running_deepseekv3_on_m4_mac_mini_ai_ai_cluster_671b/
[4] https://dev.to/mehmetakar/5-ways-to-run-llm-locally-on-mac-cck
[5] https://www.youtube.com/watch?v=U99GC7S4LUA
[6] https://www.yahoo.com/tech/beginning-end-deepseek-oes-100-183100522.html
[7] https://www.youtube.com/watch?v=WBQ2YDPODNW
[8] https://forums.macrumors.com/threads/m4-max-silicon-and-running-llms.248348/