Tutte le novità di Google I/O 2026: l'era degli agenti AI e i nuovi modelli Gemini

L’edizione 2026 della conferenza per sviluppatori di Mountain View segna uno spartiacque decisivo nell’evoluzione tecnologica dell’azienda. A dieci anni dall’adozione della filosofia aziendale incentrata sull’intelligenza artificiale, il CEO Sundar Pichai ha illustrato il passaggio da una fase di sviluppo teorico a un ecosistema in cui i modelli generativi offrono un valore pratico e quotidiano. L’approccio strategico si conferma di tipo full-stack: l’innovazione copre ogni livello dell’infrastruttura, partendo dal design di semiconduttori personalizzati, passando per i grandi modelli di base, fino ad arrivare alle piattaforme software rivolte a miliardi di utenti.

L’esplosione dei volumi di calcolo e l’adozione su scala globale

I dati statistici rilasciati delineano un panorama di adozione massiccia. L’indicatore principale per misurare questo fenomeno è il volume dei token elaborati dai sistemi dell’azienda. Rispetto ai 9,7 trilioni mensili di due anni fa e ai 480 trilioni dello scorso anno, le piattaforme gestiscono attualmente oltre 3,2 quadrilioni di token al mese, segnando una crescita di sette volte nell’arco di soli dodici mesi. Parallelamente, le API di intelligenza artificiale elaborano 19 miliardi di token al minuto, servendo una comunità di oltre 8,5 milioni di sviluppatori. Anche nel settore enterprise la domanda è in forte crescita, con oltre 375 clienti di Google Cloud che hanno individualmente superato la soglia del trilione di token.

Questa capacità infrastrutturale alimenta un portafoglio di servizi che oggi conta 13 prodotti con più di un miliardo di utenti, cinque dei quali oltrepassano i tre miliardi. Il motore principale di questa espansione è l’ecosistema Gemini. Nel contesto della Ricerca Google, la funzionalità AI Overviews ha raggiunto i 2,5 miliardi di utenti attivi mensili, mentre la più recente AI Mode ha superato il traguardo del miliardo di utenti nel suo primo anno di vita, trasformando la ricerca da singole interrogazioni a conversazioni continue.

Risultati analoghi si registrano per l’applicazione dedicata Gemini, che ha visto i propri utenti attivi mensili passare da 400 a oltre 900 milioni, con un incremento delle richieste giornaliere pari a sette volte. All’interno dell’app è stata introdotta la funzione Personal Intelligence, e i risultati visivi sono garantiti dal modello Nano Banana, responsabile della generazione di oltre 50 miliardi di immagini nell’ultimo anno.

Interfacce conversazionali avanzate: da Maps a YouTube

L’integrazione di capacità conversazionali naturali sta ridefinendo le interfacce dei servizi più popolari. Dopo l’introduzione di Ask Maps per la navigazione complessa, l’azienda ha presentato Ask YouTube. Questa funzionalità, in arrivo negli Stati Uniti nel corso dell’estate, permette agli utenti di porre domande specifiche sui contenuti e di essere indirizzati automaticamente al punto esatto del video in cui si trova la risposta.

La voce diventa lo strumento centrale anche per la produttività grazie a strumenti come Docs Live. Questo nuovo sistema permette agli utenti di creare documenti complessi tramite un semplice flusso di pensieri dettato vocalmente; l’intelligenza artificiale si occupa di strutturare il testo e, previa autorizzazione, di recuperare i dati necessari da Gmail, Drive o dal web in background. Funzionalità vocali simili sono state annunciate anche per le applicazioni Keep e Gmail Live.

Efficienza energetica e investimenti hardware: le TPU di ottava generazione

L’aumento esponenziale delle capacità di calcolo ha richiesto una profonda revisione degli investimenti in infrastrutture. La spesa in conto capitale, che si attestava a 31 miliardi di dollari nel 2022, è destinata a moltiplicarsi per sei, raggiungendo i 190 miliardi di dollari nel 2026. Al centro di questo sforzo economico si collocano i nuovi chip proprietari.

Google ha presentato la sua ottava generazione di TPU (Tensor Processing Unit), introducendo per la prima volta un’architettura differenziata basata su due chip distinti. Il processore TPU 8t è progettato specificamente per la fase di addestramento su larga scala, offrendo il triplo della potenza di calcolo grezza rispetto alla generazione passata. Supportato dai sistemi JAX e Pathways, consente di distribuire i carichi di lavoro su oltre un milione di TPU a livello globale, abbattendo i tempi di addestramento da mesi a settimane. Sul fronte dell’operatività in tempo reale interviene il processore TPU 8i, ottimizzato per i processi di inferenza e progettato per ridurre drasticamente la latenza. Entrambi i componenti hardware riescono inoltre a raddoppiare le prestazioni per watt, garantendo una maggiore sostenibilità energetica.

Gemini Omni e le nuove vette dei modelli linguistici con 3.5 Flash

L’evento ha fatto da palcoscenico per due novità assolute in ambito algoritmico. La prima è Gemini Omni, definito come un “world model” in grado di generare qualsiasi modalità di output partendo da qualsiasi input, simulando accuratamente la realtà anziché limitarsi alla previsione testuale. Questo sistema dimostra una comprensione intuitiva di principi fisici quali la gravità, la cinetica e la dinamica dei fluidi. Tramite semplici comandi conversazionali, gli utenti possono modificare video esistenti in più passaggi, alterare lo stile visivo, o generare clip complesse attingendo alla vasta base di conoscenza del modello. La prima iterazione, Gemini Omni Flash, è immediatamente disponibile sull’app Gemini, in Google Flow e per la creazione di YouTube Shorts.

Il secondo importante annuncio riguarda Gemini 3.5 Flash, un modello che bilancia prestazioni di punta e capacità di agire in modo autonomo. Nonostante costi meno della metà rispetto ai concorrenti diretti di fascia alta, il modello 3.5 Flash supera la versione precedente 3.1 Pro in quasi tutti i benchmark, registrando un balzo significativo nelle abilità di programmazione e nell’indice GDPVal (parametro che valuta l’impatto economico nelle attività del mondo reale). La sua velocità di output è superiore di quattro volte rispetto ai modelli equivalenti. Per le grandi aziende che elaborano trilioni di token al giorno, trasferire l’80% del carico su 3.5 Flash potrebbe tradursi in risparmi operativi stimati in oltre un miliardo di dollari all’anno. Questo rilascio anticipa l’arrivo della versione superiore Gemini 3.5 Pro, prevista per il mese successivo.

Agenti autonomi: Antigravity 2.0 e il lancio di Gemini Spark

L’industria sta transitando verso una nuova architettura del software in cui l’utente delega le mansioni a sistemi autonomi. A supporto di questa transizione, la piattaforma per sviluppatori Antigravity è stata aggiornata alla versione 2.0. Ora trasformata in un’applicazione desktop indipendente, permette di orchestrare coorti di agenti basati su una variante speciale del modello Flash, ottimizzata per risultare ben dodici volte più veloce degli standard di settore.

L’espressione più avanzata di questa tecnologia per l’utente finale è Gemini Spark. Si tratta di un assistente AI personale, integrato nell’app principale, operativo ventiquattro ore su ventiquattro perché eseguito direttamente su macchine virtuali residenti in Google Cloud. Spark gestisce la vita digitale dell’utente ed esegue compiti complessi in modo autonomo sotto stretta supervisione. L’interazione, inizialmente vincolata all’app, si estenderà presto a email, chat e browser Chrome, mentre i dispositivi mobili riceveranno entro l’anno un’interfaccia dedicata denominata Android Halo per monitorare le attività degli agenti in tempo reale.

Questa rivoluzione algoritmica modificherà anche la Ricerca Google, che dalla prossima estate includerà agenti informativi personalizzati per elaborare report continuativi in background. Grazie a Gemini 3.5 Flash e Antigravity, la Ricerca sarà inoltre in grado di generare dinamicamente interfacce, grafici interattivi e cruscotti di monitoraggio personalizzati per seguire compiti prolungati nel tempo.

Aggiornamenti per i flussi di lavoro: Workspace, sicurezza e strumenti scientifici

Gli annunci hanno coperto estensivamente gli strumenti professionali e creativi del pacchetto Workspace. Tra questi spicca Google Pics, una nuova applicazione per la generazione e la modifica chirurgica delle immagini guidata dal modello Nano Banana. Le sue funzionalità comprendono la segmentazione accurata degli oggetti (permette di isolare, spostare o alterare singoli elementi mantenendo intatto il background), oltre alla capacità nativa di generare, modificare e tradurre i testi direttamente all’interno delle grafiche, rispettando font e design originali.

L’ecosistema produttivo riceve in dote ulteriori agenti specializzati, come il Daily Brief all’interno dell’app Gemini, in grado di leggere e prioritizzare le informazioni provenienti da Gmail, Calendar e Tasks fornendo riassunti mattutini strategici. È stato presentato anche Google Flow, uno strumento dedicato al completamento di progetti articolati che unisce capacità di editing, brainstorming e la funzione di “vibe coding” per l’applicazione di effetti visivi o animazioni testuali in modo intuitivo. La gestione della posta beneficia dell’aggiornamento AI Inbox, in via di espansione per gli abbonati ai piani superiori: il sistema propone ora bozze di risposta altamente personalizzate, estrae automaticamente i documenti citati dalle conversazioni per renderli immediatamente accessibili, e snellisce la spunta delle attività.

Sul fronte della sicurezza e dell’etica generativa, Google ha confermato il proprio impegno nell’identificazione dei contenuti artificiali. La filigrana digitale SynthID ha già marcato oltre cento miliardi di immagini e video, e sessantamila anni di frammenti audio. I protocolli di verifica dei contenuti (C2PA) verranno incorporati in Chrome e nella Ricerca. Un passaggio cruciale è rappresentato dalla collaborazione industriale: realtà del calibro di Nvidia, OpenAI, Kakaw ed Eleven Labs hanno deciso di adottare le tecnologie SynthID per standardizzare il rilevamento dei deepfake.

Infine, l’infrastruttura di agenti ha trovato applicazione in campi altamente specializzati. Gemini for Science permette ai ricercatori di connettere gli agenti autonomi di Antigravity a oltre trenta banche dati di scienze biologiche. Sul fronte dell’hardware consumer, l’autunno vedrà il lancio di occhiali intelligenti in due varianti: modelli audio in grado di interfacciarsi vocalmente con Gemini per fornire assistenza in-ear, e modelli dotati di display visivo per integrare dati nel campo visivo dell’utente, mantenendo in entrambi i casi l’utilizzo completamente a mani libere.