Google estende l’evoluzione dell’AI con Gemini 3, nuovo modello multimodale progettato per comprensione avanzata di testo, immagini, video, audio e codice. Nel primo periodo emergono elementi centrali come Gemini 3, Google AI, Gemini 3 Pro Vision, Antigravity, Workspace, Fitbit, Chrome, Google Play Books. L’azienda presenta aggiornamenti che spaziano dalla generazione di immagini alla robotica, dalle previsioni meteo alla produttività. L’ecosistema si amplia con funzioni conversazionali in Maps e Android Auto, modelli specifici come Nano Banana Pro, infrastrutture AI da oltre 36,68 miliardi di euro in Texas e investimenti in formazione.
L’evoluzione si riflette su ricerca, shopping, educazione, editoria digitale, salute personale e sviluppo software. Gemini 3 introduce finestre di contesto estese, ragionamento avanzato e interfacce generate automaticamente, mentre gli utenti accedono a modalità conversazionali, coaching e strumenti agentici che cambiano l’esperienza quotidiana dei servizi Google.
Cosa leggere
Lancio di Gemini 3 e nuove capacità multimodali
Il rilascio di Gemini 3 Pro in anteprima per l’app Gemini, AI Mode in Search e Google AI Studio rappresenta un avanzamento sostanziale nell’integrazione dell’AI generativa. Il modello gestisce una finestra di contesto da un milione di token e analizza contenuti multimodali con precisione avanzata. L’utente riceve strumenti come Deep Research e Canvas per flussi multi-step, mentre la codifica vibe converte descrizioni naturali in interfacce web interattive. Il sistema segue istruzioni complesse e utilizza tool esterni, migliora la produttività degli sviluppatori e sintetizza informazioni in modo strutturato. Nano Banana Pro produce immagini ad alta fedeltà, distinguendosi tra editing rapido e modalità avanzata. Il modello mostra miglioramenti in ragionamento, layout generativi e supporto video, offrendo anche coaching per presentazioni tramite analisi audio e visive.
Gemini 3 Pro Vision per documenti, codifica e robotica
Gemini 3 Pro Vision spinge la comprensione documentale oltre i benchmark precedenti grazie a OCR e derendering capaci di convertire materiali complessi in codice strutturato. Il modello interpreta grafici, tabelle e piani spaziali utili per robotica e realtà aumentata. La capacità pointing identifica oggetti e coordinate con precisione pixel.

La funzione di comprensione schermo automatizza task UI mentre l’analisi video raggiunge frame rate elevati con ragionamento causa-effetto in modalità thinking. L’elaborazione di video lunghi produce codice e insight multilivello, con applicazioni in medicina, educazione e automazione. Benchmark come MMMU Pro e MedXpertQA-MM mostrano prestazioni superiori. L’accesso è disponibile via API e AI Studio.
Integrazione di Gemini nei servizi quotidiani
Google inserisce Gemini in Maps per una navigazione conversazionale. L’utente chiede indicazioni con linguaggio naturale e segnala traffico, mentre l’app suggerisce percorsi basati su punti di riferimento come ristoranti e negozi. Su Android Auto, Gemini permette interazioni naturali in oltre 250 milioni di veicoli. Gli utenti aggiungono soste, inviano messaggi, organizzano playlist e gestiscono attività con brainstorming in tempo reale. Le funzionalità si estendono a email e media, rendendo l’esperienza più fluida. Search AI Mode utilizza Canvas per generare piani di viaggio personalizzati e itinerari prenotabili. Durante lo shopping festivo, l’AI organizza risposte con visuali, prezzi e recensioni, mentre il checkout agentico completa acquisti verificando la disponibilità degli articoli tramite chiamate automatiche. NotebookLM aggiunge strumenti educativi come quiz e flashcard, mentre Gemini Live introduce conversazioni naturali con velocità regolabile per esercitazioni linguistiche e simulazioni di colloqui.
SIMA 2, previsioni meteorologiche e formazione globale
Il modello WeatherNext 2 accelera la generazione delle previsioni con una velocità otto volte superiore e risoluzione oraria, migliorando le decisioni operative delle agenzie meteorologiche. Nel settore della robotica, SIMA 2 integra Gemini in mondi virtuali tridimensionali in cui l’AI segue istruzioni, pianifica obiettivi e migliora il proprio comportamento. La combinazione di dialogo naturale e capacità deduttive alimenta progressi verso sistemi sempre più autonomi. Google investe 27,51 milioni di euro nella formazione ai mestieri digitali annunciata al forum AI for Learning di Londra. L’azienda sviluppa strumenti didattici per migliorare gli esiti scolastici e sostiene progetti globali in America, Europa, Africa e Asia-Pacifico. L’infrastruttura AI cresce con un investimento da 36,68 miliardi di euro in Texas annunciato da Sundar Pichai e Greg Abbott. Il piano forma 100.000 elettricisti e crea 30.000 apprendisti. Nel frattempo, AlphaFold celebra il quinto anniversario e il Premio Nobel per la Chimica 2024, consolidando l’impatto dell’AI nella biologia.
Aggiornamenti in Chrome per semplificare acquisti e viaggi
Chrome introduce miglioramenti significativi all’autofill per ridurre tempi ed errori durante le vacanze. Il sistema richiama dati sicuri dell’account Google e compila automaticamente nomi, email e indirizzi. L’integrazione con Wallet memorizza numeri di carte fedeltà e dettagli dei viaggi. L’utente compila moduli per shopping e noleggi auto con un singolo tocco.

Su Android, i suggerimenti appaiono in due righe sopra la tastiera e riconoscono formati globali come gli indirizzi “tra strade” utilizzati in Messico. Il riconoscimento automatico evita errori di compilazione e gestisce contesti geografici diversi.
Fitbit introduce il coach salute personale
Fitbit lancia un coach salute personale accessibile agli abbonati Premium Android negli Stati Uniti. Il sistema analizza dati su fitness e sonno, rivede fino a 30 giorni di chat precedenti e combina input da dispositivi e app.

Le raccomandazioni emergono in conversazioni brevi adattando obiettivi e insight. La piattaforma analizza anche elaborazione del glucosio e fenomeni come jet lag sociale, mentre la nutrizione registrata nel diario arricchisce lo storico. Gli utenti possono fornire feedback diretto per affinare la qualità delle risposte.
Google Play Books celebra quindici anni
La piattaforma Google Play Books compie quindici anni ed è ora presente in oltre 75 paesi con un catalogo che supera i 10 milioni di ebook e audiolibri. Dal 5 al 7 dicembre gli utenti ricevono 15x punti Play sugli acquisti, indipendentemente dal livello attuale. La piattaforma offre anteprime illimitate e campioni audiolibri disponibili anche su YouTube.

I libri per bambini includono modalità Read and Listen. La wishlist notifica riduzioni di prezzo e la sezione Upcoming permette preordini con filtri per calendario. Gli abbonamenti a serie vengono addebitati al rilascio e i bundle scontati organizzano saghe e autori. Le note sincronizzate con Drive, gli scaffali personalizzati e lo zoom per i fumetti migliorano l’esperienza. La Family Library consente la condivisione con fino a cinque membri.
Antigravity e preferenze AI in Workspace
Nel sondaggio di Google Workspace condotto con Harris Poll, oltre il 90% dei lavoratori tra 22 e 39 anni richiede servizi AI personalizzati per tono e output. I giovani leader costruiscono workflow come architetti dell’AI e traggono fiducia da risposte mirate. Le esigenze principali includono personalizzazione e applicazioni pratiche. Google aggiorna i limiti di Antigravity, aumentando le quote per abbonati Pro e Ultra. La priorità si aggiorna ogni cinque ore, mentre gli utenti gratuiti passano a un limite settimanale. Le operazioni dipendono dalla complessità del compito, ma tutti ricevono accesso a Gemini 3 Pro con completamenti codice illimitati. Il sistema si integra con Agent Manager e browser per ampliarne l’utilità.
Deep Think e dimostrazioni di Gemini 3
La funzione Deep Think migliora ragionamento, matematica, scienza e logica sfruttando varianti basate su Gemini 2.5 premiate in competizioni internazionali. Il modello raggiunge il 41,0% nel benchmark Humanity’s Last Exam e utilizza ragionamento parallelo per esplorare ipotesi multiple. Le demo mostrano la capacità di creare visualizzazioni codificate, analizzare video per hobby e generare interfacce user-friendly da immagini statiche. Gli agenti gestiscono processi multi-step come la classificazione email, lasciando agli utenti la conferma delle azioni critiche.