Il sorpasso dei bot AI sul traffico umano segna uno spartiacque nella storia di internet. Secondo l’allarme lanciato da Matthew Prince, CEO e co-fondatore di Cloudflare, il traffico generato da agentic traffic, scraper AI e bot LLM rappresenta ormai il 57,5 per cento delle richieste HTTP, contro il 42,5 per cento prodotto dagli utenti reali. Il dato arriva con quasi un anno di anticipo rispetto alle previsioni e conferma che la rete non è più attraversata principalmente da persone, ma da agenti automatici che leggono pagine, confrontano prodotti, estraggono contenuti, interrogano servizi, generano richieste ripetute e alimentano l’ecosistema dei modelli di intelligenza artificiale. Nello stesso arco temporale, Sam Altman ammette che i costi dei token AI stanno diventando un problema enorme per i clienti di OpenAI, mentre Satya Nadella presenta per Microsoft data center closed-loop a basso consumo idrico per rispondere alle critiche sull’impatto ambientale dell’AI. Le tre dichiarazioni, concentrate tra il 2 e il 4 giugno 2026, descrivono un sistema sotto stress simultaneo: internet subisce un carico automatizzato senza precedenti, le aziende bruciano budget interi in inferenza e i data center diventano terreno di conflitto ambientale.
Cosa leggere
Cloudflare registra il sorpasso storico dei bot AI sugli utenti umani
Il dato diffuso da Cloudflare segna una rottura netta con l’architettura sociale della rete. I bot AI non sono più una componente laterale del traffico, ma la sua parte dominante. Matthew Prince osserva che il sorpasso è avvenuto molto più rapidamente del previsto e ammette che si aspettava un crossover tra fine 2027 e inizio 2027, mentre la crescita del traffico agentico ha anticipato ogni previsione. Il punto tecnico è decisivo: Cloudflare non parla dei crawler tradizionali dei motori di ricerca né soltanto dei bot malevoli usati per frodi, spam o credential stuffing. La nuova categoria riguarda agenti AI che navigano il web per conto di utenti reali o di sistemi automatizzati, leggono pagine di prodotto, confrontano prezzi, raccolgono dati, alimentano sistemi di risposta, indicizzano contenuti per modelli linguistici e svolgono compiti multi-step. Questo traffico è diverso da quello umano non solo per volume, ma per ritmo.

Un utente reale apre una pagina, resta su un’app, guarda un video, scorre un feed o interagisce con un servizio. Un agente AI può generare decine, centinaia o migliaia di richieste in sequenza, consumando banda, CPU, cache, storage e risorse applicative in modo molto più intenso. Il 57,5 per cento delle richieste HTTP attribuite ai bot contro il 42,5 per cento degli utenti reali mostra quindi un internet in cui la presenza umana resta centrale nel tempo speso, ma non più nel volume delle richieste generate.
L’agentic traffic cambia la natura economica della rete
La crescita dell’agentic traffic modifica il rapporto tra contenuti, server e valore economico. I bot AI non navigano come utenti tradizionali e non sempre generano ricavi proporzionali al carico che producono. Uno scraper può leggere migliaia di pagine senza visualizzare pubblicità, senza iscriversi a un servizio, senza comprare un prodotto e senza contribuire direttamente al modello economico del sito visitato. Questo crea una frattura strutturale tra chi sostiene i costi di infrastruttura e chi cattura valore dai contenuti estratti. Cloudflare osserva che i dati storici restano parzialmente disordinati perché la classificazione di nuovi visitatori come agenti firmati o bot verificati è relativamente recente, ma il trend appare ormai evidente. Alcuni territori mostrano percentuali estremamente elevate: Gibraltar raggiunge il 92,1 per cento di traffico bot, mentre Singapore e Iran arrivano al 76,4 per cento. Nel caso iraniano, la dinamica potrebbe essere collegata anche all’uso massiccio di VPN, scraping automatizzato e bypass geografici. Il dato più importante resta però globale: gli agenti AI stanno producendo carichi che i sistemi web tradizionali non erano stati progettati per sostenere. La rete costruita per utenti umani, browser e crawler relativamente prevedibili deve ora reggere automazioni rapide, distribuite, ripetitive e spesso difficili da monetizzare. Questo squilibrio spinge verso nuove forme di autenticazione del traffico, rate limiting, licensing dei contenuti, paywall machine-readable e sistemi di controllo sull’accesso degli agenti ai dati pubblici.
Sam Altman ammette il problema dei costi dei token AI
Mentre Cloudflare misura l’impatto infrastrutturale dei bot, Sam Altman riconosce il problema economico che si nasconde dietro la crescita dell’AI: i token costano troppo quando l’uso diventa massivo. Durante l’evento Intelligence at Work, il CEO di OpenAI ammette che per la prima volta i clienti aziendali iniziano a lamentarsi apertamente dei costi e cita una frase diventata ricorrente tra i manager: una società può consumare nel primo trimestre l’intero budget previsto per il 2026. Il fenomeno non riguarda solo l’uso occasionale di chatbot, ma l’esplosione di agenti, workflow automatizzati, chiamate API, sistemi di coding assistito, customer service AI, analisi documentale e processi interni basati su LLM. Altman ricorda che sei anni e mezzo fa il principale cliente aziendale consumava circa 100 mila token al mese, mentre oggi quella cifra rappresenta la media globale pro capite. Il leader attuale arriva a 100 miliardi di token al mese e alcuni clienti consumano ancora di più. Questo salto indica che la domanda non cresce in modo lineare, ma segue la logica dell’automazione: più i modelli diventano utili, più vengono incorporati nei processi, più generano chiamate, più consumano token. Il problema diventa quindi sistemico perché l’AI promette efficienza, ma può generare nuove voci di costo difficili da controllare.
Il tokenmaxxing espone il paradosso economico dell’AI
Il fenomeno descritto da Sam Altman viene sintetizzato nel termine tokenmaxxing, cioè l’uso estremo e crescente di token AI dentro processi aziendali che non sempre producono ritorni proporzionali. Il paradosso è quello di Jevons: quando una risorsa diventa più efficiente o meno costosa, il suo consumo complessivo può aumentare invece di diminuire. Nel caso dei token AI, modelli più veloci ed economici spingono le aziende a usarli di più, non necessariamente a spendere meno. Gli agenti AI amplificano il problema perché non generano una singola risposta, ma possono decomporre un’attività in decine di step, interrogare strumenti esterni, consultare documenti, scrivere codice, validare output, ripetere tentativi e mantenere contesto. Ogni passaggio consuma token. Altman ammette che tra gli investitori la spesa eccessiva è ormai diventata un meme, ma dietro l’ironia c’è una questione industriale. Se un’impresa scopre che far funzionare modelli AI costa quanto o più del personale che dovrebbe supportare, il modello di adozione entra in crisi. OpenAI promette architetture più efficienti e maggiore valore a parità di spesa, ma il problema resta aperto: l’economia dell’inferenza deve diventare prevedibile, misurabile e controllabile. Senza questa disciplina, l’AI rischia di trasformarsi da leva di produttività a centro di costo fuori controllo.
Microsoft risponde alla pressione ambientale con data center closed-loop
La terza dimensione della crisi arriva dall’infrastruttura fisica. Satya Nadella, durante Microsoft Build 2026, presenta una nuova generazione di data center AI con raffreddamento closed-loop progettato per ridurre drasticamente il consumo idrico. La promessa è forte: il circuito di raffreddamento viene riempito una sola volta e il data center può operare efficacemente con zero consumo idrico operativo continuo. Secondo Microsoft, il consumo annuo di un intero impianto di nuova generazione può equivalere a quello di un singolo ristorante, un confronto pensato per rispondere alle critiche rivolte ai data center tradizionali da 100 MW o più, capaci di consumare decine o centinaia di milioni di galloni d’acqua ogni anno attraverso sistemi evaporativi. Il nuovo modello usa liquido che circola in loop chiuso tra hardware AI e chiller, assorbe calore, viene raffreddato e torna in circolo senza evaporazione continua. Oltre il 90 per cento del raffreddamento avviene attraverso questo circuito, mentre solo in condizioni di caldo estremo può intervenire una quota limitata di aria esterna con uso minimo di acqua aggiuntiva. Il primo impianto, Fairwater, situato a Mount Pleasant in Wisconsin, usa già il nuovo design e Microsoft prevede di estenderlo ai futuri data center AI. La novità risponde a un problema reale: l’AI non consuma soltanto token e banda, ma acqua, energia, suolo, reti elettriche e accettazione sociale delle comunità locali.
Il limite della svolta idrica resta il parco data center esistente
La soluzione di Microsoft rappresenta un passo tecnico importante, ma non risolve automaticamente l’impatto dell’infrastruttura già esistente. Nadella inserisce il raffreddamento closed-loop nella strategia Community-First AI Infrastructure e nel percorso verso l’obiettivo water positive entro il 2030, cioè restituire più acqua di quanta l’azienda consuma. Tuttavia il beneficio del modello “livello ristorante” vale soprattutto per i nuovi impianti, non per l’intero parco globale di Azure. Microsoft gestisce oltre 500 data center in 80 regioni e la maggior parte delle strutture esistenti non prevede un retrofit immediato verso il nuovo sistema. Questo significa che il problema idrico resta distribuito, locale e politico. Le comunità che ospitano data center chiedono trasparenza su consumo d’acqua, energia, impatto termico e pressione sulle infrastrutture pubbliche. Anche Google ha annunciato impegni simili per il 2030, segno che tutto il settore percepisce la sostenibilità idrica come uno dei principali rischi reputazionali dell’AI. La crescita dei modelli, l’aumento degli agenti e l’espansione dell’inferenza locale e cloud richiedono nuovi impianti, ma ogni nuovo impianto entra in territori fisici con vincoli ambientali, politici e sociali. Il raffreddamento closed-loop riduce una parte del problema, ma non elimina la domanda di calcolo che lo ha generato.
Traffico, token e acqua diventano la stessa crisi infrastrutturale
Le dichiarazioni di Matthew Prince, Sam Altman e Satya Nadella descrivono tre facce dello stesso punto di non ritorno. Il 57,5 per cento di traffico bot misurato da Cloudflare mostra che gli agenti AI hanno già cambiato il carico tecnico di internet. I costi dei token AI denunciati da OpenAI mostrano che l’automazione intelligente può erodere budget aziendali molto più velocemente di quanto i CFO avessero previsto. I data center closed-loop presentati da Microsoft mostrano che l’infrastruttura fisica necessaria a sostenere questa crescita deve essere ripensata prima che la pressione ambientale diventi insostenibile. Questi tre elementi si alimentano a vicenda. Più agenti AI navigano il web, più richieste HTTP vengono generate. Più richieste e più agenti significano più chiamate a modelli, più token, più inferenza e più calcolo. Più calcolo richiede più data center, più energia e più sistemi di raffreddamento. L’AI non è quindi soltanto un prodotto software, ma una macchina infrastrutturale globale che consuma risorse digitali, finanziarie e fisiche. La sorpresa di Prince, l’imbarazzo operativo di Altman e la risposta ingegneristica di Nadella mostrano che le grandi piattaforme stanno inseguendo una crescita più rapida delle proprie previsioni. Il problema non è più capire se l’AI cambierà internet, ma come impedire che internet, i bilanci aziendali e le comunità locali paghino il prezzo di un’espansione senza controllo.
Iscriviti alla Newsletter
Non perdere le analisi settimanali: Entra nella Matrice Digitale.
Matrice Digitale partecipa al Programma Affiliazione Amazon EU. In qualità di Affiliato Amazon, ricevo un guadagno dagli acquisti idonei. Questo non influenza i prezzi per te.








