Deepseekin kaupallisen hylly (COTS) -laitteiden käyttö parantaa huomattavasti sen kustannustehokkuutta monilla tärkeimmillä tavoilla:
1. Vähentyneiden infrastruktuurikustannusten kustannukset: Hyödyntämällä COTS-laitteistoa DeepSek välttää kalliiden, erikoistuneiden järjestelmien tarpeen, joita tyypillisesti vaaditaan korkean suorituskyvyn AI-kehitykseen. Tämä lähestymistapa laskee infrastruktuurikustannukset, mikä tekee edistyneistä AI -ominaisuuksista, jotka ovat helpommin saatavissa pienempiin yrityksiin ja vähentämään AI -markkinoiden pääsyn taloudellisia esteitä [1] [3].
2. Tekniikat, kuten asiantuntijoiden seoksen (MOE) arkkitehtuuri, antavat mallin aktivoida vain tarvittavat parametrit tietyille tehtäville, minimoimalla laskennalliset jätteet ja vähentämällä huippuluokan GPU: n tarvetta [3] [10]. Tämä kohdennettu lähestymistapa ei vain leikkaa kustannuksia, vaan myös pidentää laitteistojen elinkaarta ja vähentää energiankulutusta.
3. Virtaviivainen koulutusprosessi: DeepSek ohittaa perinteiset koulutusvaiheet, kuten valvottu hienosäätö (SFS), toteuttamalla suoran putkilinjan esikäsittelystä vahvistuksen oppimiseen ihmisen palautteesta (RLHF). Tämä virtaviivainen prosessi vähentää sekä mallin kehittämiseen tarvittavia koulutusaikaa että laskennallisia resursseja, mikä lisää kustannustehokkuutta [1] [3].
4. Tietojen tislaus: DeepSeek tisikoi onnistuneesti suuremmista malleista pienempiin ilman merkittävää suorituskyvyn heikkenemistä. Esimerkiksi se pakatti 671B-parametrimallin 70B: ksi, ylläpitäen melkein identtistä suorituskykyä. Tämä mallin koon tehokkuus mahdollistaa vähemmän tehokkaiden laitteistojen käyttöönoton, yhdenmukaistamisen COTS -strategian kanssa ja vähentää toimintakustannuksia [1] [3].
On kuitenkin myös raportteja, jotka viittaavat siihen, että Deepseekin todellinen laitteistoinvestointi saattaa olla huomattavampi kuin alun perin väitetty, arviot osoittavat merkittävät menot GPU: lle [4]. Tästä huolimatta yrityksen lähestymistapa kustannustehokkaan laitteiston hyödyntämiseen ja ohjelmistojen tehokkuuden optimoimiseen on edelleen avaintekijä kustannustehokkuudessa verrattuna kilpailijoihin, kuten OpenAi [2] [3].
Kaiken kaikkiaan Deepseekin COTS-laitteistojen käyttö yhdistettynä innovatiivisiin ohjelmistooptimointiin asettaa sen johtajana kustannustehokkaassa AI-kehityksessä, joka tarjoaa sekä taloudellisia että strategisia etuja AI-maisemassa [2] [3].
Viittaukset:
.
.
[3] https://www.chitika.com/deepseek-enterprise-implications/
.
.
.
.
[8] https://www.byteplus.com/en/topic/382891
.
[10.