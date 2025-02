Il vero costo di DeepSeek

Il rapporto di SemiAnalysis stima che il costo totale in conto capitale (CapEx) per i server di DeepSeek sia di ben 1,3 miliardi di dollari. Questo imponente investimento serve a mantenere in funzione gli enormi cluster di GPU che alimentano la potenza di calcolo del modello. Si parla di circa 50.000 GPU, ma non tutte sono del modello H100 di NVIDIA, come erroneamente si credeva. L'inventario include una combinazione di modelli, tra cui H800, H100 e H20, scelti in base alle restrizioni alle esportazioni imposte dagli Stati Uniti. DeepSeek, a differenza di altri grandi laboratori di AI, gestisce i propri data center, una strategia che, secondo SemiAnalysis, le conferisce maggiore agilità ed efficienza.

Il modello R1 di DeepSeek dimostra capacità di ragionamento paragonabili a quelle di o1 di OpenAI. Tuttavia, non è il leader indiscusso in tutti i parametri. Nonostante la strategia di prezzo abbia attirato l'attenzione, Gemini Flash 2.0 di Google, con capacità simili, risulta più conveniente tramite le sue API. Una delle innovazioni di DeepSeek è la tecnologia Multi-Head Latent Attention (MLA), che riduce i costi di inferenza del 93,3%. Questa innovazione, secondo il rapporto, potrebbe essere presto adottata da altri laboratori di AI occidentali.

Il rapporto di SemiAnalysis prevede un aumento dei costi operativi di DeepSeek fino a cinque volte entro la fine dell'anno. Nonostante le innovazioni e l'efficienza, la competizione nel settore AI è feroce, e il vantaggio competitivo di DeepSeek potrebbe essere di breve durata.

Nel frattempo, l'algoritmo di DeepSeek, che è Open Source, inizia a circolare e molti servizi, come Groq, ma anche Azure di Microsoft, l'hanno implementato nella propria offerta.