

Al centro di questa corsa all'oro digitale rimane Nvidia, un'azienda che ha visto i suoi ricavi più che raddoppiare anno su anno, consolidando il suo ruolo di fornitore chiave. La concorrenza ciononostante si sta intensificando in modo palpabile. Colossi come Google e Amazon investono massicciamente nello sviluppo di chip proprietari, come i TPU, Trainium e Inferentia. L'obiettivo è chiaro: ridurre la dipendenza dalle GPU esterne e ottimizzare le proprie operazioni. Parallelamente, si osserva una tendenza crescente tra i clienti a progettare soluzioni personalizzate, collaborando con partner specializzati come Broadcom. La battaglia per il predominio tecnologico non riguarda più solo il training, l’addestramento iniziale dei modelli AI. Ora si sposta decisamente sull'inference, la fase cruciale in cui i modelli addestrati elaborano e producono risposte. In questo nuovo scenario, il successo dipende da chi offre la migliore combinazione tra velocità e costi operativi. Le previsioni finanziarie rimangono estremamente aggressive e sostengono il boom semiconduttori AI.



Secondo le analisi di Goldman Sachs, si stima che entro il 2026 Nvidia possa raggiungere vendite di GPU e hardware correlato per 383 miliardi di dollari. Le proiezioni di FactSet, invece, indicano ricavi combinati superiori ai 538 miliardi di dollari per un gruppo selezionato di leader del settore:

- Nvidia;

- Intel;

- Broadcom;

- AMD;

- Qualcomm.

Queste cifre non includono nemmeno le attività relative ai chip interni di Google e Amazon, che non vengono scorporate nei loro bilanci. In parallelo, la domanda di chip riceve un ulteriore e potentissimo sostegno dai piani di espansione dei data center. Basti pensare che Microsoft ha annunciato l'intenzione di raddoppiare la propria impronta infrastrutturale nel corso dei prossimi due anni. La crescita non è solamente una questione di ordini. È legata in modo indissolubile alla capacità fisica di costruire e, soprattutto, di alimentare i complessi di calcolo che costituiscono l'infrastruttura data center.



Emergono difficoltà critiche sul fronte delle forniture. Si registrano carenze strutturali di componenti chiave per l'infrastruttura elettrica, come trasformatori e turbine, e si sommano alle difficoltà di garantire la necessaria energia per l’alimentazione continua di questi complessi. Lo shortage si estende anche alle parti specifiche dei server AI. È interessante notare come l'inference sia tipicamente più memory-bound, cioè dipendente dalla memoria, rispetto al training. Questo fenomeno accresce la pressione sulle memorie ad alta banda, note come HBM, e sui materiali avanzati, come i substrati sottili, creando effetti a cascata sui prezzi e sui tempi di consegna che interessano l'infrastruttura data center a livello globale. Rimangono interrogativi fondamentali sul piano della sostenibilità finanziaria AI. Gran parte di questa espansione massiva è finanziata attraverso accordi plurimiliardari tra i laboratori di ricerca AI e gli hyperscaler

- della nuvola. Il mercato è diventato estremamente sensibile a qualsiasi segnale di rallentamento nella raccolta di capitali o a una compressione dei margini operativi.



Nondimeno, il 2026 si prospetta come un altro anno potenzialmente da record. Sarà un vero e proprio banco di prova su un doppio binario: quello della capacità di approvvigionamento di chip e quello della sostenibilità finanziaria AI della spesa. Esiste il rischio concreto che il boom perda il suo slancio se i flussi finanziari non riusciranno a tenere il passo con le esigenze dell'infrastruttura fisica.