
La nascita dei neocloud, provider indipendenti di GPU-as-a-service (GPUaaS), è una risposta diretta alla scarsità globale di capacità di calcolo ad alte prestazioni e alle strategie di diversificazione dei ricavi dei principali produttori di chip avanzati. In origine, i neocloud sono emersi come soluzioni temporanee per far fronte alla carenza di GPU, ma la loro economia basata sul bare-metal-as-a-service (BMaaS) è fragile. La loro sostenibilità nel lungo periodo dipende dalla capacità di salire nella “stack” e offrire servizi nativi di AI, entrando così in competizione diretta con gli hyperscaler. È però probabile che il loro futuro non risieda nel tentativo di rivaleggiare con gli hyperscaler, bensì nel conquistare posizioni in nicchie di mercato destinate a durare, come il compute sovrano e i workload specializzati, e nel rafforzare le relazioni già avviate con le start-up dell’AI, rapporti che possono proseguire man mano che queste crescono fino a diventare piattaforme da miliardi di dollari.
I neocloud offrono contratti più flessibili, tempi di provisioning più rapidi e configurazioni infrastrutturali specializzate. Inoltre, applicano prezzi fino all’85% inferiori rispetto a quelli degli hyperscaler, rendendole una scelta molto interessante per le start-up più piccole attive nella generative AI. Presentano inoltre barriere d’ingresso più basse rispetto ai provider cloud tradizionali: mettere in piedi un cluster di calcolo non richiede la costruzione di un’intera tech stack, come avviene per le piattaforme hyperscale, e questo consente ai nuovi operatori di muoversi rapidamente per intercettare una domanda rimasta insoddisfatta. Oggi nel mondo esistono più di 100 neocloud: tra dieci e quindici operano su scala significativa negli Stati Uniti, e la loro presenza è in crescita in Europa, Medio Oriente e Asia, spesso sostenute da venture capital, private equity o fondi sovrani.
Quattro convinzioni chiave stanno alimentando gli investimenti nei neocloud:
- Il modello BMaaS è solo un punto di partenza. Il modello BMaaS adottato da molti neocloud è intrinsecamente standardizzato: offre una differenziazione limitata, richiede investimenti elevati e porta a una competizione basata principalmente sul prezzo. Ma gli investitori non stanno puntando sul BMaaS come punto di arrivo. La tesi d’investimento alla base delle neocloud è che riusciranno a passare a stack software nativi per l’AI, che includono strumenti per l’orchestrazione del training, piattaforme di inferenza distribuita, stack specifici per settore (per esempio per le scienze della vita o i servizi finanziari), strumenti per sviluppatori e servizi gestiti di machine learning. Questi livelli aggiuntivi permetteranno di aumentare la fidelizzazione dei clienti, migliorare la retention e ottenere economie simili a quelle delle software company, consentendo ai neocloud di raggiungere multipli comparabili al software-as-a-service.
- La domanda di capacità di calcolo è troppo grande per essere ignorata. Anche se i neocloud dovessero restare ancorate al modello BMaaS, la curva della domanda di calcolo per l’AI è ripida e in forte accelerazione. Il fabbisogno di capacità per training e inference continuerà a crescere rapidamente (si stima possa raggiungere circa 200 gigawatt entro il 2030), con l’offerta infrastrutturale come principale collo di bottiglia. In un contesto simile, qualsiasi provider credibile con rack operativi online può ragionevolmente aspettarsi di trovare acquirenti.
- Le flotte di calcolo ammortizzate mantengono un valore residuo nel lungo periodo. I neocloud possono utilizzare grandi accordi di offtake a basso margine con gli hyperscaler per finanziare l’acquisizione delle flotte e costruire scala, prolungando poi la vita economica degli asset noleggiandoli a tariffe più basse alle imprese che non hanno bisogno dell’ultima generazione di chip. In teoria, questo potrebbe creare un modello di business duraturo, anche se non è ancora chiaro se le aziende adotteranno workload AI su una scala sufficiente ad assorbire questa capacità “di seconda vita”.
- I produttori di chip possono svolgere un vero effetto di derisking. Sebbene il supporto dei produttori di chip non garantisca la sopravvivenza dei neocloud, crea comunque una sorta di paracadute implicito. I produttori di chip forniscono spesso ai neocloud allocazioni preferenziali, strutture di finanziamento e persino impegni di acquisto, aumentando così le probabilità che queste realtà riescano a restare sul mercato.
I neocloud hanno il potenziale per consolidarsi nel tempo, ma l’economia del modello BMaaS, oggi prevalente, è poco promettente per tre motivi:
- I margini lasciano pochissimo spazio per errore – Nel modello BMaaS, i margini lordi si collocano tipicamente tra il 55 e il 65% prima dell’ammortamento, a seconda del tasso di utilizzo e dei prezzi. Con questi margini lordi e con il livello di intensità di capitale richiesto per acquistare GPU e CPU e attivare i server, il modello BMaaS dispone di un margine di sicurezza quasi nullo ed è vulnerabile alle oscillazioni di prezzo e di utilizzo. Se il prezzo di noleggio delle GPU cala anche di poco, o se il tasso di utilizzo scende sotto l’80%, i ritorni si azzerano. L’economia diventa ancora più fragile se si aggiunge il finanziamento a debito, perché i costi degli interessi erodono rapidamente qualsiasi cuscinetto residuo.
- Erosione dei prezzi e intensità di capitale frenano gli investimenti – Il ciclo di rilascio dei chip esercita un’ulteriore pressione sui livelli di prezzo. A ogni nuova generazione, il prezzo delle GPU più vecchie scende. Su un tipico orizzonte di ammortamento di cinque anni, il costo orario di una GPU può dimezzarsi o anche più. Questa dinamica impone ai service provider non solo di recuperare il capitale entro i primi quattro-cinque anni dall’entrata in funzione della GPU in un data center, per evitare che gli asset restino “bloccati”, ma anche di reinvestire continuamente nelle nuove generazioni per restare competitivi, man mano che le flotte precedenti perdono rilevanza.
- I grandi contratti sono meno redditizi di quanto sembri – Secondo alcune fonti, il margine di profitto lordo delle attività di noleggio GPU è compreso tra il 14 e il 16% dopo costi di lavoro, energia e ammortamenti, un livello inferiore ai margini di molti retailer non tech Per i neocloud, questi contratti sono interessanti più per ciò che consentono che per la loro redditività intrinseca: garantiscono infatti un livello di utilizzo quasi assicurato e offrono un “sigillo” di credibilità che rende la neocloud più attraente per gli investitori, favorendo così il fundraising futuro. Dal lato opposto, gli hyperscaler sono disposti a pagare un premio per avere capacità immediatamente disponibile e per poter sfruttare i bilanci delle neocloud per alleggerire i propri asset. Il risultato è una forte concentrazione dei ricavi per molti operatori neocloud. Dati pubblici mostrano che, per alcuni player, oltre la metà dei ricavi proviene da uno o due soli clienti.
I prossimi passi per i neocloud
Il modello neocloud incorpora un paradosso strutturale. Gli investitori si aspettano che questi provider salgano lungo la stack tecnologica, sviluppando software nativi per l’AI e servizi gestiti. Ma questa evoluzione finisce per metterli in concorrenza diretta con gli hyperscaler che, paradossalmente, oggi rappresentano proprio i loro principali clienti. Stratificare servizi più avanzati, dall’orchestrazione del training alle piattaforme di inference fino alle soluzioni verticali, aumenta fidelizzazione e marginalità, ma sovrappone l’offerta delle neocloud a quella dei hyperscaler. E costruire una tecnologia abbastanza robusta per competere, insieme a una strategia commerciale capace di entrare nel mercato enterprise, richiede un impegno enorme in termini di capitale, tempo e competenze. Per uscire da una logica di “commodity”, le neocloud devono quindi differenziarsi senza alienare gli stessi hyperscaler che garantiscono il loro utilizzo minimo. Da qui tre possibili percorsi, nel medio-lungo periodo, affinché le neocloud possano sopravvivere:
- Sviluppare posizioni difendibili in nicchie specifiche. I player con maggiori probabilità di durare saranno quelli capaci di ritagliarsi spazi in segmenti dove gli hyperscaler sono meno adatti o meno benvenuti. È il caso, per esempio, dei provider di “compute sovrano”, sostenuti da governi o campioni regionali, che privilegiano l’indipendenza dagli hyperscaler per via del focus iperlocale e della gestione di dati sensibili.
- Puntare su startup e crescere con loro. Un’altra traiettoria sostenibile è mantenere come core target le start-up dell’AI invece di inseguire le grandi aziende. Offrendo capacità di calcolo fin dalle primissime fasi, i neocloud possono costruire relazioni di fiducia che durano quando le start-up diventano piattaforme da miliardi di dollari con esigenze computazionali enormi.
- Consolidarsi. Il consolidamento rappresenta un terzo scenario. Come accaduto alle start-up del Cloud 1.0, alcune neocloud finiranno probabilmente assorbite da hyperscaler, telco o investitori sovrani. Altre, una volta che l’offerta tornerà a coprire la domanda, tenderanno a uscire dal mercato.























































