OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale

di Maria Silvano
0 commenti
openai google aws ai cloud

OpenAI sta testando ChatGPT Atlas, un browser basato su Chromium che integra azioni agentiche direttamente nella navigazione web, mentre Google conferma ufficialmente che Gemini resterà privo di pubblicità e AWS introduce retrieval multimodale in Bedrock insieme a nuove istanze EC2 G7e accelerate da GPU Blackwell. Queste tre direttrici mostrano come l’AI stia passando da strumento isolato a livello operativo continuo, integrato nei flussi quotidiani di utenti, sviluppatori e imprese.

OpenAI e ChatGPT Atlas: il browser diventa un agente

Con OpenAI il browser smette di essere un semplice contenitore di pagine e diventa un ambiente agentico. ChatGPT Atlas integra l’assistente AI direttamente nella navigazione, consentendo di fare domande, sintetizzare contenuti, completare task e interagire con le pagine senza cambiare tab o copiare link. L’obiettivo è ridurre il costo cognitivo dello switch continuo tra applicazioni e trasformare la navigazione in un flusso assistito.

image 565
OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale 23

Tra le funzioni più rilevanti emerge il video understanding applicato a YouTube, con generazione automatica di timestamp per individuare rapidamente i passaggi chiave di un video. La modalità agente può aprire nuove schede, cliccare elementi e seguire workflow, mantenendo però limiti di sicurezza sui siti sensibili. Atlas introduce anche browser memories, che permettono al sistema di ricordare contesti di siti già visitati, annunci di lavoro consultati o contenuti ricorrenti, migliorando il recupero di informazioni nel tempo.

image 566
OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale 24

Sul fronte safety, OpenAI ha avviato il rollout globale di un modello di predizione dell’età degli utenti ChatGPT. Il sistema analizza pattern conversazionali, temi trattati e orari di utilizzo per stimare se l’utente sia minorenne, applicando automaticamente restrizioni su contenuti violenti, sfide virali o materiale sensibile. In caso di errore, gli utenti adulti possono verificare l’età tramite selfie live e documento governativo, con cancellazione dei dati entro sette giorni. È un passaggio chiave verso una moderazione proattiva basata su AI, non più solo reattiva.

Parallelamente, OpenAI ha confermato l’introduzione di annunci pubblicitari in ChatGPT per gli utenti free negli Stati Uniti, visualizzati nella parte bassa delle risposte rilevanti ed esclusi da ambiti come salute e politica. I piani a pagamento restano ad-free, e la monetizzazione pubblicitaria viene presentata come leva per ridurre i limiti di utilizzo.

Google: Gemini senza ads e Firestore Enterprise più potente

Sul versante opposto, Google ha chiarito che Gemini non avrà pubblicità, almeno nell’attuale strategia. Demis Hassabis ha ribadito che l’obiettivo è mantenere l’esperienza focalizzata su qualità del ragionamento e utilità del modello, marcando una differenza netta rispetto all’approccio di ChatGPT per il segmento consumer.

image 567
OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale 25

Con Gemini 3 Flash, Google punta su ragionamento multimodale veloce, pensato per task agentici, coding, planning e applicazioni a bassa latenza. Il modello è disponibile via Google AI Studio e Vertex AI, con Playground interattivo che consente di regolare parametri di reasoning e generare codice pronto per l’esecuzione locale o in produzione. L’attenzione è chiaramente rivolta agli sviluppatori, con SDK GenAI e structured outputs orientati a casi d’uso reali.

In parallelo, Google ha introdotto il nuovo motore di query di Firestore Enterprise, che abilita pipeline di oltre 100 operazioni per aggregazioni complesse, filtri granulari e unnest di array, senza l’obbligo di creare indici per ogni scenario. Questo riduce drasticamente l’overhead operativo nello sviluppo di applicazioni avanzate, dall’e-commerce alle piattaforme social. Firestore Enterprise integra strumenti di query explain, observability e profiling, consentendo di monitorare latenza e ottimizzare i costi, con promesse di risparmi significativi sulle operazioni di lettura.

AWS: Bedrock multimodale e nuove istanze EC2 G7e

image 568
OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale 26

Sul fronte infrastrutturale, Amazon Web Services spinge sull’AI enterprise con l’introduzione del retrieval multimodale in Bedrock Knowledge Bases. La novità consente di costruire applicazioni RAG fully managed capaci di gestire testo, immagini, video e audio in modo nativo, eliminando pipeline custom complesse. Il retrieval cross-modale permette, ad esempio, di interrogare un video tramite una query testuale e ottenere risposte contestuali.

image 569
OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale 27

AWS propone due approcci complementari. Il primo utilizza Nova Multimodal Embeddings, che codificano direttamente contenuti visivi e audio in uno spazio vettoriale comune, supportando chunk video da 30 secondi e oltre 200 lingue. Il secondo sfrutta Data Automation, che converte contenuti multimediali in descrizioni testuali e trascrizioni con timestamp, mantenendo compatibilità con pipeline RAG tradizionali. Lo storage vettoriale su S3 consente performance sub-second anche su dataset estesi.

image 570
OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale 28

Dal punto di vista hardware, AWS ha annunciato le nuove istanze EC2 G7e, basate su GPU NVIDIA RTX PRO 6000 Blackwell, con performance di inferenza AI fino a 2,3 volte superiori rispetto alla generazione precedente. Le istanze supportano modelli fino a 70 miliardi di parametri su singola GPU, con configurazioni fino a 8 GPU e 768 GB di memoria, networking potenziato e GPUDirect RDMA con Elastic Fabric Adapter per carichi distribuiti ad alta intensità.

image 571
OpenAI, Google e AWS accelerano su AI e cloud: browser agentico, Gemini senza pubblicità e Bedrock multimodale 29

Accanto a G7e, arrivano anche le EC2 X8i memory-optimized, con processori Intel Xeon 6 custom e turbo fino a 3,9 GHz, pensate per workload memory-intensive e certificazioni SAP. AWS completa il quadro con una guida dettagliata alla migrazione in-place verso Apache Iceberg, utilizzando DynamoDB come control plane per tracciare stato ed errori, abilitando ACID, schema evolution e time travel senza riscrittura dei dati Parquet.

Cloud sovrano, tool e implicazioni operative

Nella roundup settimanale, AWS ha evidenziato miglioramenti alla Kiro CLI, con controlli granulari su fetch URL, allowlist e blocklist per agenti AI, gestione multi-agent e shortcut da tastiera. È stata inoltre annunciata la disponibilità generale dell’AWS European Sovereign Cloud, progettata per rispondere a requisiti di sovranità e compliance europea con un set completo di servizi.

L’insieme di queste novità mostra una convergenza chiara. OpenAI spinge sull’integrazione seamless dell’AI nell’esperienza utente, Google rafforza l’attrattività developer-first senza pubblicità, mentre AWS riduce drasticamente la complessità ingegneristica per AI multimodale e workload generativi su scala enterprise. Il risultato è un ecosistema in cui AI, cloud e infrastruttura non sono più strati separati, ma componenti di un’unica piattaforma operativa.

Domande frequenti su novità AI e cloud OpenAI, Google e AWS

Cosa rende ChatGPT Atlas diverso da un browser tradizionale?

ChatGPT Atlas integra un assistente AI agentico direttamente nella navigazione, permettendo di porre domande, sintetizzare contenuti e completare task sulle pagine web senza cambiare tab o applicazione.

Perché Google ha scelto di mantenere Gemini senza pubblicità?

Google punta a differenziare Gemini mantenendo un’esperienza focalizzata su qualità del modello e utilità per utenti e sviluppatori, evitando distrazioni e conflitti con l’obiettivo di reasoning avanzato.

In cosa consiste il retrieval multimodale di AWS Bedrock?

Il retrieval multimodale consente di interrogare basi di conoscenza che includono testo, immagini, video e audio, usando embedding nativi o descrizioni automatiche, semplificando lo sviluppo di applicazioni RAG avanzate.

Qual è il vantaggio delle istanze EC2 G7e per l’AI generativa?

Le EC2 G7e offrono GPU Blackwell con maggiore bandwidth, memoria e networking, permettendo inferenza più veloce e l’esecuzione di modelli di grandi dimensioni anche su singola istanza.

Iscriviti a Matrice Digitale

Ricevi le notizie principali direttamente nella tua casella di posta.

Niente spam, disiscriviti quando vuoi.


Matrice Digitale partecipa al Programma Affiliazione Amazon EU, un programma di affiliazione che consente ai siti di percepire una commissione pubblicitaria pubblicizzando e fornendo link al sito Amazon.it.