Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kaip „Deepseek“ efektyvumas naudojant senesnius lustus daro įtaką jo našumui


Kaip „Deepseek“ efektyvumas naudojant senesnius lustus daro įtaką jo našumui


„Deepseek“ senesnių lustų panaudojimas, būtent „NVIDIA A100“ ir „H800“ modeliai, daro didelę įtaką jo našumui ir eksploatavimo efektyvumui. Šis požiūris yra tiesioginis atsakas į JAV eksporto kontrolę, kuri riboja galimybes naudotis pažangiausiomis technologijomis, priversdamas „Deepseek“ naujovėms įgyvendinti šias apribojimus.

našumo optimizavimas naudojant senesnius lustus

1. Ekonominis efektyvumas: pasinaudodamas senesniais lustais, „Deepseek“ sugebėjo sukurti savo R1 modelį per nedidelę kainą, palyginti su konkurentais. Pranešama, kad bendrovė išleido tik 6 milijonus dolerių skaičiavimo galiai, kuri yra žymiai mažesnė nei milijardai, kuriuos išleido tokios firmos kaip „Openai“ už panašias galimybes [3] [8]. Šis ekonominis efektyvumas leidžia „Deepseek“ pasiūlyti konkurencingą savo AI paslaugų kainą, apmokestinant tik 0,55 USD už milijoną įvesties žetonų, palyginti su „Openai“ 15 USD [3].

2. Novatoriški dizaino pasirinkimai: „Deepseek“ inžinieriai optimizavo savo mokymo procesus, kad kompensuotų senesnės aparatūros apribojimus. Pavyzdžiui, jie užprogramavo 20 iš 132 kiekvieno „H800“ lusto apdorojimo vienetų, skirtų tvarkyti kryžminio lusto ryšį, o tai yra unikali optimizavimo strategija, paprastai neįmanoma, naudojant sudėtingesnius lustus, tokius kaip H100 [2]. Šis optimizavimo lygis leidžia „Deepseek“ išlaikyti aukštą našumą, nepaisant to, kad naudojama mažiau galingos aparatinės įrangos.

3. Algoritminis efektyvumas: Bendrovė naudoja pažangias technikas, tokias kaip ekspertų mišinys (MOE), kuris apdorojimo metu suaktyvina tik parametrų pogrupį, padidindamas skaičiavimo efektyvumą neprarandant našumo [8]. Šis selektyvus aktyvavimas leidžia „Deepseek“ pasiekti rezultatus, panašius į tuos, kurie yra iš sistemų, naudojant žymiai daugiau išteklių.

4. Pritaikymas prie suvaržymų: JAV sankcijų nustatytas apribojimai netyčia paskatino naujoves „Deepseek“. Poreikis dirbti su ribotais ištekliais paskatino įmonę sukurti labai efektyvius algoritmus ir mokymo metodus, kurie maksimaliai padidina jų turimos aparatūros galimybes [5] [7]. Kaip pažymėjo ekspertai, ši situacija privertė Kinijos kompanijas, tokias kaip „Deepsee“, tapti išradingesnėmis ir novatoriškesnėmis požiūriu į PG plėtrą [7].

Poveikis našumui

„Deepseek“ pasitikėjimas senesniais lustais ne tik atspindi atsarginę variantą; Tai tapo kertiniu jų strategijos akmeniu. Bendrovės galimybė optimizuoti savo modelius aplink H800 lustų apribojimus, konkrečiai spręsdami atminties pralaidumo problemas, rodo, kad veiksminga programinės įrangos inžinerija kartais gali nusverti naujesnės aparatinės įrangos pranašumus [2] [4].

Apibendrinant galima pasakyti, kad nors „Deepseek“ senesnių lustų naudojimas kyla dėl būtinybės dėl eksporto apribojimų, tai paskatino nepaprastas efektyvumo ir išlaidų valdymo naujoves. Tai ne tik apibūdina „Deepseek“ kaip didžiulį konkurentą AI kraštovaizdyje, bet ir pabrėžia, kaip suvaržymai gali paskatinti reikšmingą technologijos ir metodikos pažangą.

Citatos:
[1] https://www.reddit.com/r/investing/comments/1ib5vf9/deepseek_uses_nvidias_h800_chips_so_why_are/
[2] https://stratechery.com/2025/deepseek-faq/
[3] https://evrimagaci.org/tpg/deepseek-ai-model-disruts-global-tech-markets-163143
[4] https://blog.heim.xyz/deepseek- what-he-headlines-siss/
[5] https://www.prolificnorth.co.uk/news/who-is-behind-deepseek-chinese-startup-defining-ai-and- rattling-global-markets/
[6] https://arxiv.org/html/2412.19437v1
[7] https://tribune.com.pk/story/2524438/chinas-deepseek-ai-model-challenges-us-dominance-amid-s--sanctions
[8] https://writesonic.com/blog/deepseek-launches-ai-reasoning-model