L’intelligenza artificiale continua a evolversi verso modelli sempre più capaci di comprendere il contesto e mantenere continuità nelle interazioni. Le ultime novità annunciate da Google e Amazon Web Services mostrano chiaramente questa direzione. Da una parte Gemini Live acquisisce la capacità di accedere alla memoria delle conversazioni passate e ai dati provenienti da applicazioni collegate, riducendo la necessità per gli utenti di ripetere informazioni già condivise. Dall’altra AWS rende generalmente disponibile Amazon Bedrock AgentCore, una piattaforma progettata per accelerare lo sviluppo e la gestione di agenti autonomi in ambienti enterprise, accompagnandola con nuove funzionalità di osservabilità avanzata tramite CloudWatch e SageMaker Insights. Questi aggiornamenti segnano un passo importante verso assistenti più personali e piattaforme aziendali più mature, in grado di costruire, eseguire e monitorare sistemi di intelligenza artificiale complessi con livelli superiori di affidabilità e controllo.
Cosa leggere
Gemini Live introduce la memoria persistente tra conversazioni
Google ha esteso a Gemini Live una delle funzionalità più richieste dagli utenti: la possibilità di ricordare informazioni condivise in conversazioni precedenti. Il sistema può ora accedere alla funzione Memory e utilizzare dati provenienti da alcune applicazioni collegate per fornire risposte più contestuali e personalizzate. In pratica l’assistente può ricordare preferenze alimentari, hobby, eventi personali, appuntamenti ricorrenti e altri dettagli comunicati dall’utente nel tempo. Questo elimina la necessità di ripetere continuamente lo stesso contesto durante nuove sessioni. La funzionalità è stata distribuita successivamente all’evento Google I/O 2026 ed è inizialmente disponibile in lingua inglese per gli utenti statunitensi. Secondo Google, Gemini Live è ora in grado di utilizzare in modo sicuro i ricordi provenienti dalle conversazioni passate e le informazioni disponibili nelle applicazioni autorizzate, offrendo una continuità molto più naturale rispetto alle precedenti versioni dell’assistente.
Come Gemini Live utilizza il contesto personale
L’elemento più importante dell’aggiornamento riguarda la capacità di mantenere il contesto tra sessioni separate. Le conversazioni non vengono più trattate come eventi isolati ma diventano parte di una cronologia coerente che l’assistente può consultare quando necessario. Se un utente ha parlato in passato di una dieta specifica, di un viaggio programmato o di interessi particolari, Gemini Live può richiamare automaticamente queste informazioni durante una nuova interazione.

Questo approccio rende l’esperienza molto più simile a una conversazione umana continua. Google ha precisato che il sistema utilizza gli stessi meccanismi di autorizzazione e controllo della privacy già presenti nella piattaforma Gemini tradizionale, senza introdurre privilegi aggiuntivi. L’obiettivo è aumentare l’utilità dell’assistente mantenendo inalterato il livello di protezione dei dati personali.
Le applicazioni integrate ampliano le capacità dell’assistente
La nuova memoria non si limita alle conversazioni precedenti ma può essere arricchita dai dati provenienti da applicazioni integrate nell’ecosistema Google. Tra le piattaforme già supportate figurano YouTube, Google Workspace, servizi di utilità e strumenti dedicati alla generazione di immagini. L’integrazione con Google Messages è invece ancora in fase di distribuzione. Questa architettura permette a Gemini Live di costruire una comprensione più ampia delle attività e delle preferenze dell’utente, creando un livello di personalizzazione superiore rispetto ai tradizionali assistenti vocali. Durante i test condotti dalla community tecnica, il sistema ha dimostrato di poter recuperare correttamente informazioni provenienti da sessioni precedenti senza richiedere all’utente di ricostruire manualmente il contesto. L’assistente si avvicina così al concetto di memoria persistente che molte aziende considerano uno dei pilastri della prossima generazione di IA conversazionale.
Amazon Bedrock AgentCore raggiunge la disponibilità generale
Sul fronte enterprise, Amazon Web Services ha annunciato la disponibilità generale di Amazon Bedrock AgentCore, una piattaforma progettata per semplificare la creazione e la gestione di agenti di intelligenza artificiale autonomi. Il servizio mira a ridurre drasticamente la complessità infrastrutturale che normalmente accompagna lo sviluppo di sistemi agentici avanzati. AgentCore fornisce una serie di componenti preconfigurati che comprendono Runtime, Memory, Gateway, Browser, Identity e Observability, consentendo alle organizzazioni di concentrarsi sulla logica degli agenti anziché sulla gestione dell’infrastruttura sottostante. AWS presenta il servizio come una soluzione capace di portare un agente dalla fase di progettazione alla produzione in pochi minuti, eliminando gran parte del codice di orchestrazione normalmente necessario.
Il framework harness semplifica la distribuzione degli agenti
Uno degli elementi centrali di AgentCore è il sistema denominato harness, che funge da livello di astrazione per l’intera infrastruttura. Attraverso semplici chiamate API come CreateHarness e InvokeHarness, gli sviluppatori possono definire, distribuire ed eseguire agenti senza gestire direttamente componenti di rete, sistemi di isolamento o meccanismi di scalabilità.

Il framework supporta modelli provenienti da diversi fornitori, inclusi Amazon Bedrock, OpenAI, Google Gemini e provider compatibili tramite LiteLLM. Questa flessibilità consente alle organizzazioni di modificare il modello utilizzato durante una sessione senza perdere il contesto operativo. Gli strumenti possono essere collegati mediante configurazione anziché tramite codice personalizzato, riducendo significativamente tempi di sviluppo, costi di manutenzione e complessità architetturale.
Memoria, strumenti e osservabilità integrati in AgentCore
AWS ha integrato nel servizio una serie di funzionalità normalmente distribuite tra più prodotti differenti. La componente Memory utilizza tecniche di ricerca semantica e summarization con crittografia gestita direttamente da AWS e conservazione dei dati fino a trenta giorni. Gli sviluppatori possono inoltre caricare Skills sotto forma di repository Git, bucket S3 o immagini containerizzate. L’ambiente operativo include filesystem persistenti, shell dedicate e diverse opzioni di storage. Uno degli aspetti più rilevanti riguarda però l’osservabilità, che permette di monitorare in tempo reale sessioni, metriche e tracce operative attraverso l’integrazione con CloudWatch. Sono inoltre disponibili sistemi di valutazione automatica basati su modelli linguistici e strumenti per effettuare test comparativi tra configurazioni differenti. Questo approccio consente di trattare gli agenti IA come veri e propri servizi di produzione, dotati degli stessi strumenti di monitoraggio e controllo utilizzati nelle applicazioni enterprise tradizionali.
SageMaker Insights porta oltre cento nuove metriche su CloudWatch
Contestualmente al lancio di AgentCore, AWS ha introdotto un importante aggiornamento dedicato al monitoraggio delle inferenze di intelligenza artificiale generativa. Attraverso SageMaker Insights, ora integrato in CloudWatch, le organizzazioni possono accedere a oltre cento nuove metriche operative. Le informazioni raccolte coprono aspetti fondamentali come salute delle GPU, utilizzo delle risorse, distribuzione del traffico tra zone di disponibilità e latenza delle inferenze.

Particolare attenzione è stata dedicata alle metriche specifiche dei modelli generativi, tra cui Time to First Token, Inter-Token Latency, pressione della KV Cache e diagnostica relativa ai cold start. Questi indicatori permettono di comprendere con maggiore precisione il comportamento dei modelli in produzione e di identificare rapidamente eventuali colli di bottiglia.
Una dashboard progettata per l’intelligenza artificiale generativa
La nuova dashboard SageMaker Insights è organizzata in tre aree principali dedicate a prestazioni, capacità e affidabilità. Gli amministratori possono visualizzare informazioni a livello di fleet, endpoint o singolo componente di inferenza, ottenendo una panoramica dettagliata dello stato operativo delle infrastrutture AI. Le metriche vengono esportate utilizzando standard OpenTelemetry e diventano disponibili all’interno di CloudWatch nel giro di pochi minuti dall’attivazione. Per gli endpoint esistenti è sufficiente abilitare la funzione EnableDetailedObservability per iniziare a raccogliere i nuovi dati. Questa visibilità consente di individuare rapidamente cause di rallentamenti, problemi di capacità insufficiente o distribuzione non ottimale dei carichi di lavoro tra le diverse zone di disponibilità.
Assistenti più intelligenti e agenti più affidabili
Le novità annunciate da Google e AWS mostrano due direzioni complementari nello sviluppo dell’intelligenza artificiale. Gemini Live punta a rendere l’esperienza utente più naturale grazie alla memoria persistente e alla capacità di mantenere il contesto personale nel tempo. AgentCore e SageMaker Insights affrontano invece il problema dal punto di vista aziendale, offrendo strumenti che permettono di creare, distribuire e monitorare agenti autonomi con livelli elevati di affidabilità e osservabilità. In entrambi i casi emerge una tendenza comune: l’IA non viene più considerata soltanto un sistema capace di generare risposte, ma una piattaforma che deve ricordare, comprendere, adattarsi e operare in modo continuo all’interno di ambienti complessi. La combinazione di memoria persistente, automazione avanzata e monitoraggio dettagliato rappresenta uno dei principali indicatori della maturazione dell’intero settore verso applicazioni sempre più integrate nella vita quotidiana e nei processi aziendali.
Iscriviti alla Newsletter
Non perdere le analisi settimanali: Entra nella Matrice Digitale.
Matrice Digitale partecipa al Programma Affiliazione Amazon EU. In qualità di Affiliato Amazon, ricevo un guadagno dagli acquisti idonei. Questo non influenza i prezzi per te.









