Google / 20 Maggio 2026 / Di Redazione

Google porta Gemini 3.5 Flash e Omni nei video con comandi vocali

Google annuncia Gemini 3.5 Flash e Gemini Omni durante Google I/O 2026, portando intelligenza artificiale di frontiera a velocità record e strumenti video controllati con prompt vocali. I nuovi modelli cambiano il modo in cui utenti, sviluppatori, creator e aziende interagiscono con l’AI, combinando ragionamento agentico, generazione multimediale e automazione dei workflow complessi. Gemini 3.5 Flash entra subito in rotazione globale come modello predefinito nell’app Gemini e nella modalità AI di Google Search, raggiungendo miliardi di utenti in tutto il mondo. Il modello unisce ragionamento profondo, velocità della famiglia Flash ed esecuzione di compiti a lungo termine, superando Gemini 3.1 Pro nei benchmark dedicati al coding e alle attività agentiche. Google lo descrive come quattro volte più veloce rispetto ad altri modelli di frontiera in termini di token di output al secondo, mantenendo al tempo stesso una qualità elevata nelle risposte. Questa velocità permette di sviluppare applicazioni complete, mantenere codebase legacy, generare interfacce web interattive e preparare documenti aziendali in tempi molto più ridotti. Gemini Omni rappresenta invece il salto verso video nativi generati e modificati attraverso input multimodali, inclusi testo, immagini, audio, video e schizzi. La vera novità consiste nell’editing conversazionale: l’utente parla al sistema e ottiene modifiche immediate su scene, camera, musica, luci ed effetti senza usare timeline tradizionali.

Cosa leggere

Gemini 3.5 Flash accelera coding e workflow agentici complessi

Gemini 3.5 Flash si distingue per la capacità di orchestrare sub-agenti, processare informazioni in parallelo e completare attività lunghe senza perdere coerenza. Gli sviluppatori possono usare il modello per trasformare codebase legacy in applicazioni moderne basate su Next.js, generare interfacce web complete o creare ambienti interattivi partendo da descrizioni testuali. Il sistema supporta loop di auto-miglioramento che analizzano il risultato, individuano errori, correggono il codice e iterano fino al raggiungimento dell’obiettivo. Questa impostazione rende possibile passare dalla sintesi di paper scientifici alla costruzione di un gioco funzionante in poche ore, riducendo i passaggi manuali normalmente richiesti nei workflow di sviluppo. Google presenta Gemini 3.5 Flash come il modello più forte mai rilasciato dall’azienda per coding e attività agentiche, con prestazioni superiori a Gemini 3.1 Pro nei test specifici.

Google porta Gemini 3.5 Flash e Omni nei video con comandi vocali 5

La velocità quattro volte superiore nella generazione di output consente di gestire task che prima richiedevano attese molto più lunghe. Per gli sviluppatori, il vantaggio non riguarda solo la rapidità della risposta ma anche la possibilità di delegare sequenze operative più articolate, dalla scrittura del codice alla documentazione tecnica fino al refactoring.

Google integra Gemini 3.5 Flash in app, Search e strumenti developer

Annuncio

Google rende Gemini 3.5 Flash immediatamente disponibile nell’app Gemini, nella modalità AI di Google Search, nella Gemini API, in Google AI Studio, in Android Studio e nella piattaforma agentica Google Antigravity. Questa distribuzione ampia consente al modello di entrare subito nei flussi di lavoro quotidiani di utenti consumer, sviluppatori indipendenti e aziende enterprise. Nell’app Gemini, il modello diventa l’opzione predefinita per interazioni complesse ma rapide. In Google Search, potenzia risposte AI più articolate, capaci di combinare ragionamento, ricerca contestuale e sintesi informativa. Per i developer, l’accesso tramite API e ambienti di sviluppo riduce il tempo necessario per integrare capacità agentiche nelle applicazioni.

Android Studio diventa un canale strategico perché porta il modello direttamente nel processo di sviluppo mobile, dove debugging, generazione di codice e suggerimenti architetturali possono incidere in modo concreto sulla produttività. Google Antigravity completa il quadro con un’infrastruttura pensata per agenti AI capaci di agire in modo autonomo su attività tecniche complesse. La strategia di distribuzione mostra un obiettivo preciso: rendere Gemini 3.5 Flash non solo un chatbot più veloce, ma un livello operativo diffuso nell’ecosistema Google.

Gemini 3.5 Flash migliora sicurezza e riduce i rifiuti errati

Google afferma di avere rafforzato i meccanismi di training sulla sicurezza in Gemini 3.5 Flash, riducendo sia la produzione di contenuti dannosi sia il rifiuto errato di richieste legittime. Questo equilibrio risulta decisivo per un modello destinato a miliardi di utenti e a flussi enterprise ad alto valore. Nei contesti aziendali, un modello troppo permissivo aumenta il rischio di abuso, mentre un modello troppo restrittivo blocca workflow produttivi e riduce l’utilità reale dell’AI. Gemini 3.5 Flash punta a migliorare questa soglia attraverso controlli più granulari, interpretazione contestuale più precisa e maggiore capacità di distinguere query sicure da richieste problematiche. Il miglioramento interessa soprattutto coding, documentazione, analisi finanziarie, asset management e generazione di interfacce. Le aziende possono usarlo per rinominare e categorizzare asset non strutturati, sintetizzare documenti, produrre UX complete per checkout o elaborare forecast di vendita su piattaforme come Shopify. Le integrazioni enterprise con Salesforce, Databricks e Gemini Enterprise estendono il modello a processi dove accuratezza, governance e tracciabilità contano quanto la velocità. In questo senso, la sicurezza diventa una componente della produttività e non un semplice vincolo tecnico.

Gemini Spark porta agenti personali AI nelle attività quotidiane

L’integrazione con Gemini Spark amplia ulteriormente il ruolo di Gemini 3.5 Flash nei workflow personali. Spark viene descritto come un agente personale AI attivo 24 ore su 24, capace di navigare la vita digitale dell’utente, eseguire azioni autonome e completare iterazioni complesse senza richiedere controllo costante.

Google porta Gemini 3.5 Flash e Omni nei video con comandi vocali 6

Il rollout parte da tester fidati e si estende successivamente alla beta per gli abbonati Google AI Ultra negli Stati Uniti. La combinazione tra modello veloce e agente persistente apre scenari più avanzati rispetto al classico assistente conversazionale. L’utente può affidare a Spark attività distribuite su più passaggi, come organizzare documenti, seguire processi online, generare riepiloghi, preparare bozze operative o monitorare attività digitali ricorrenti. La velocità di Gemini 3.5 Flash rende questi flussi meno frammentati e più vicini a un’interazione in tempo reale. Per Google, il punto non è soltanto rispondere meglio alle domande, ma permettere all’AI di eseguire compiti concreti e mantenere memoria operativa del contesto. Questa evoluzione rafforza la direzione agentica dell’intero ecosistema Gemini, dove il modello non si limita a produrre testo ma diventa un motore di azione.

Gemini Omni trasforma il montaggio video in una conversazione

Gemini Omni introduce un cambio radicale nella creazione e modifica dei video, trasformando l’editing in una conversazione naturale. Il modello accetta input multimodali come testo, immagini, video, audio e schizzi, poi produce clip cinematografiche complete o modifica contenuti esistenti sulla base di comandi vocali. L’utente può chiedere di cambiare una scena, spostare la camera, sincronizzare luci e musica, aggiungere elementi dinamici o applicare effetti visivi senza intervenire manualmente su timeline, keyframe e livelli.

Google posiziona questa tecnologia come alternativa alle suite di editing tradizionali per molti casi d’uso creativi, soprattutto quando rapidità e iterazione contano più del controllo tecnico frame per frame. La caratteristica più importante è la memoria delle istruzioni precedenti: Gemini Omni conserva il contesto della sessione, mantiene coerenza tra modifiche successive e consente workflow multi-step fluidi. Un creator può caricare uno schizzo, un video grezzo e una traccia audio, poi chiedere a voce di trasformare la sequenza in una clip stilizzata con movimenti specifici. Il modello interpreta l’intenzione, applica le modifiche e mantiene continuità visiva. Questo approccio rende la produzione video più accessibile anche a chi non possiede competenze professionali di montaggio.

Gemini Omni usa consapevolezza fisica per video più realistici

La qualità di Gemini Omni dipende anche dalla sua capacità di rispettare principi fisici reali come gravità, energia cinetica e dinamica dei fluidi. Questa consapevolezza fisica riduce molte incoerenze tipiche dei precedenti strumenti AI per video, dove oggetti, movimenti e interazioni spesso cambiavano forma o comportamento tra un fotogramma e l’altro. Con Gemini Omni, gli oggetti cadono in modo plausibile, i fluidi si muovono con maggiore naturalezza e le interazioni tra elementi mantengono una logica visiva più stabile. Questa proprietà diventa decisiva nelle sessioni creative lunghe, dove più modifiche successive rischiano normalmente di compromettere coerenza, prospettiva e continuità narrativa. Il modello non lavora solo sulla superficie estetica della scena ma interpreta relazioni spaziali, dinamiche di movimento e vincoli fisici. Il risultato sono video più credibili, specialmente in contenuti educativi, spiegazioni scientifiche, storytelling animato e visual narrativi complessi. Google mostra esempi in cui semplici bozze vengono trasformate in explainers didattici, clip promozionali o avatar digitali capaci di replicare aspetto e voce dell’utente. La combinazione tra input multimodale, memoria contestuale e realismo fisico colloca Gemini Omni in una categoria più avanzata rispetto ai generatori video AI basati solo su prompt testuali.

SynthID protegge i video AI contro deepfake e abuso

Google integra in ogni video prodotto da Gemini Omni un watermark invisibile SynthID, progettato per garantire tracciabilità e mitigare rischi di abuso. La misura risponde direttamente alle preoccupazioni su deepfake, contenuti manipolati e video generati con finalità ingannevoli. L’avanzamento degli strumenti video AI rende infatti sempre più difficile distinguere contenuti reali, modificati e completamente sintetici. Con SynthID, Google tenta di mantenere un livello di identificabilità tecnica senza compromettere l’esperienza creativa dell’utente. Il watermark invisibile non altera la resa del video ma consente di riconoscere l’origine generativa del contenuto attraverso sistemi dedicati. Questa scelta diventa particolarmente rilevante quando Gemini Omni permette di creare avatar digitali che riproducono aspetto e voce dell’utente. Da un lato, questa funzione apre possibilità importanti per tutorial, storytelling, formazione e contenuti personalizzati senza riprese fisiche. Dall’altro, impone un controllo rigoroso per evitare impersonificazione e manipolazione. Google presenta SynthID come parte integrante della propria strategia di AI responsabile, insieme ai controlli di sicurezza già applicati ai modelli Gemini. La protezione dei contenuti generati diventa quindi un elemento strutturale del prodotto, non una funzione accessoria.

YouTube Shorts e YouTube Create ricevono Gemini Omni per creator

Gemini Omni Flash, la prima versione pubblica del modello video, arriva agli abbonati Google AI Pro e Google AI Ultra attraverso l’app Gemini e Google Flow. Gli utenti di YouTube Shorts e YouTube Create ricevono invece accesso gratuito a partire da questa settimana, con l’obiettivo di portare generazione e montaggio AI direttamente nei flussi creativi più popolari dell’ecosistema Google. Questa distribuzione è strategica perché permette ai creator di sperimentare video generati o modificati con prompt vocali senza installare software professionali. Un creator può produrre clip brevi, contenuti educativi, format narrativi o avatar digitali personalizzati partendo da materiali minimi.

YouTube Shorts beneficia in modo particolare della rapidità di iterazione: la creazione di contenuti verticali richiede spesso tempi brevi, variazioni frequenti e adattamento rapido ai trend. Gemini Omni può ridurre il tempo necessario per passare da idea a pubblicazione, trasformando comandi vocali in modifiche visive coerenti. Google Flow diventa invece l’ambiente più adatto a workflow creativi più strutturati, dove l’utente combina prompt, asset multimediali e sequenze video. L’API per sviluppatori e clienti enterprise arriverà nelle settimane successive, ampliando l’uso del modello oltre l’ambito creator.

Gemini 3.5 Pro resta in test mentre Google accelera la roadmap AI

Accanto a Gemini 3.5 Flash e Gemini Omni, Google conferma che Gemini 3.5 Pro resta in fase di test interno e arriverà il mese prossimo come modello flagship successivo. Questa roadmap mostra una strategia a doppio binario: da un lato un modello Flash veloce, globale e operativo per miliardi di utenti; dall’altro un modello Pro destinato probabilmente a compiti ancora più complessi, dove profondità di ragionamento e qualità massima avranno priorità sulla latenza. Gemini Omni completa la strategia portando l’AI generativa nel dominio video con una logica nativa e multimodale. Il ritmo degli aggiornamenti conferma la volontà di Google di competere in modo aggressivo nella fase più avanzata dell’intelligenza artificiale generativa. La disponibilità immediata dei modelli in strumenti consumer, developer ed enterprise riduce la distanza tra annuncio e adozione reale. Per sviluppatori e imprese, questo significa poter costruire prodotti e processi sopra capacità già accessibili, senza attendere lunghi cicli di rollout. Per gli utenti finali, significa vedere l’AI integrata direttamente nelle applicazioni quotidiane, dalla ricerca web alla creazione video.

Gemini 3.5 Flash e Omni cambiano produttività, sviluppo e creatività

L’arrivo simultaneo di Gemini 3.5 Flash e Gemini Omni segna una fase nuova per l’ecosistema AI di Google. Il primo modello accelera coding, workflow agentici, automazione aziendale e attività complesse a lungo termine; il secondo trasforma la creazione video in un processo conversazionale controllato con prompt vocali. Gli sviluppatori ottengono uno strumento più rapido per prototipare applicazioni, modernizzare codebase, generare interfacce e gestire documentazione tecnica. Le imprese possono ridurre tempi operativi su analisi, categorizzazione, forecast, asset management e processi interni. I creator, invece, ricevono un sistema capace di generare clip, modificare scene, creare avatar digitali e produrre contenuti multimediali senza competenze avanzate di editing. La presenza del watermark SynthID prova a mitigare i rischi di abuso, mentre le integrazioni con Gemini, Search, Google AI Studio, Android Studio, YouTube Shorts e Google Flow garantiscono una diffusione immediata. Gemini 3.5 Flash e Gemini Omni non rappresentano semplici aggiornamenti tecnici, ma un passaggio verso un’intelligenza artificiale che esegue, crea, modifica e collabora in modo sempre più naturale. Google punta così a trasformare l’AI da strumento di risposta a infrastruttura operativa per produttività, sviluppo software e produzione multimediale.

Iscriviti alla Newsletter

Non perdere le analisi settimanali: Entra nella Matrice Digitale.

Matrice Digitale partecipa al Programma Affiliazione Amazon EU. In qualità di Affiliato Amazon, ricevo un guadagno dagli acquisti idonei. Questo non influenza i prezzi per te.