Google Cloud migliora Vertex AI Agent Builder, Memorystore for Valkey, Workload Manager e Kubernetes

di Maria Silvano
0 commenti
Google Cloud

Google Cloud annuncia un vasto aggiornamento dell’intero ecosistema, introducendo miglioramenti a Vertex AI Agent Builder, Memorystore for Valkey, Workload Manager e Kubernetes, insieme a nuove linee guida su sostenibilità software e cybersecurity. L’obiettivo è consolidare la leadership nel settore dell’AI cloud e fornire alle imprese strumenti più potenti, scalabili ed efficienti per la gestione delle applicazioni intelligenti. Queste innovazioni riflettono un approccio strategico che unisce prestazioni, governance, responsabilità ambientale e sicurezza informatica, ridefinendo il modo in cui le aziende progettano, sviluppano e mantengono soluzioni AI in ambienti distribuiti. Le novità includono funzionalità avanzate per la costruzione di agenti AI contestuali e governabili, nuove opzioni di caching e networking per workload di machine learning, un modello operativo sostenibile basato sui principi 4Ms e una serie di strumenti di automazione finanziaria che integrano policy di conformità in tempo reale. Le imprese che adottano questi aggiornamenti, come PayPal, Color Health e Geotab, registrano già miglioramenti tangibili nella resilienza, nella riduzione dei costi e nella velocità di deployment.

Vertex AI Agent Builder e la nuova generazione di agenti intelligenti

Il rinnovato Vertex AI Agent Builder consente agli sviluppatori di costruire e scalare agenti dotati di memoria contestuale, sicurezza integrata e capacità di autogestione. L’integrazione dell’Agent Development Kit (ADK) permette di configurare contesti statici e cache personalizzate attraverso un’API dedicata, riducendo l’uso di token e migliorando l’efficienza del modello. I plugin adattivi introducono meccanismi di self-healing, con agenti in grado di ritentare autonomamente chiamate fallite o di diagnosticare errori attraverso dashboard di osservabilità che mostrano metriche, latenze e trace visuali delle sessioni.

image 141
Google Cloud migliora Vertex AI Agent Builder, Memorystore for Valkey, Workload Manager e Kubernetes 11

L’ambiente di debug integrato nel Playground semplifica la sperimentazione, mentre l’Evaluation Layer offre la possibilità di simulare performance tramite un User Simulator. Le identità degli agenti sono ora gestite tramite IAM con privilegi minimi e integrate con il Security Command Center per il rilevamento delle minacce. La funzionalità Model Armor protegge gli agenti da attacchi di prompt injection e mantiene la coerenza dei contesti sensibili.

image 142
Google Cloud migliora Vertex AI Agent Builder, Memorystore for Valkey, Workload Manager e Kubernetes 12

A trarre vantaggio da questo ecosistema è Color Health, che utilizza Vertex AI per agenti dedicati allo screening del cancro e alla pianificazione delle cure. Anche PayPal adotta l’Agent Payment Protocol per orchestrare workflow di pagamento complessi con visibilità passo per passo, mentre Geotab inaugura un Agent Center of Excellence per accelerare i cicli di sviluppo e il rilascio enterprise. Il nuovo motore Agent Engine consente la transizione diretta dai prototipi alla produzione e offre una versione gratuita per i test iniziali, riducendo drasticamente i tempi di innovazione.

Memorystore for Valkey e la scalabilità del caching distribuito

L’azienda statunitense Buildertrend ha completato con successo la migrazione a Memorystore for Valkey, passando da infrastrutture basate su Redis a un sistema completamente gestito e distribuito su Google Cloud. La piattaforma gestisce oltre 300 istanze simultanee e 30.000 richieste al secondo, garantendo alta disponibilità e replica nativa tra regioni. Valkey elimina la necessità di layer proxy, esporta i dati direttamente su Cloud Storage e sfrutta Private Service Connect per connessioni sicure. La replica cross-region automatica riduce il downtime, mentre la gestione trasparente delle chiavi di sessione e dello stato dei job consente a Buildertrend di servire più di un milione di utenti nel settore edilizio. Grazie alla sua architettura cloud-native, il sistema migliora la collaborazione tra team, riduce il time to market e garantisce un livello di efficienza che supera le soluzioni concorrenti.

Sostenibilità software e principi 4Ms

Google Cloud introduce un approccio sistemico alla sostenibilità software, sintetizzato nei principi Machine, Model, Mechanisation e Map, che promuovono un uso consapevole delle risorse computazionali. La selezione di risorse ad alte prestazioni per watt, la preferenza per modelli di AI ottimizzati e la pianificazione dei carichi di lavoro in base alla disponibilità di energia pulita sono i pilastri di questa filosofia. Le nuove Ironwood TPUs aumentano di trenta volte l’efficienza energetica rispetto alle generazioni precedenti, mentre le infrastrutture globali raggiungono un Power Usage Effectiveness (PUE) di 1,09, tra i valori più bassi del settore. Google Cloud promuove inoltre un framework denominato Sustainable by Design, che integra le considerazioni ambientali nel ciclo di vita del software, dall’ideazione al deployment. Progetti come Green Light, che ottimizza la sincronizzazione dei semafori urbani, e Project Contrails, che riduce le scie di condensazione degli aerei, dimostrano come l’AI possa essere un alleato concreto nella riduzione dell’impatto ambientale. Queste iniziative si accompagnano a programmi di formazione come gli AI Days Nordics, dove sviluppatori e imprese discutono strategie di efficienza energetica e innovazione sostenibile.

Workload Manager e governance finanziaria automatizzata

image 143
Google Cloud migliora Vertex AI Agent Builder, Memorystore for Valkey, Workload Manager e Kubernetes 13

Con il nuovo Workload Manager, Google Cloud automatizza la gestione FinOps, trasformando la governance dei costi in un processo continuo e misurabile. Basato sul linguaggio OPA Rego, il sistema consente di codificare regole di compliance e ottimizzazione finanziaria, come la gestione delle etichette BigQuery, il ciclo di vita degli oggetti in Cloud Storage e le politiche di retention dei dati.

image 144
Google Cloud migliora Vertex AI Agent Builder, Memorystore for Valkey, Workload Manager e Kubernetes 14

Le aziende possono definire ambiti di valutazione, filtri e cadenze di controllo con esportazione automatica su BigQuery e visualizzazione immediata tramite Looker Studio. L’adozione di policy predefinite riduce gli errori manuali e offre audit semplificati, permettendo risparmi fino al 95% dei costi operativi in alcuni scenari. Un free tier consente di testare il servizio, mentre le organizzazioni più grandi implementano pipeline di valutazione continua con notifiche automatiche via Slack e PagerDuty.

Networking avanzato per carichi AI

La crescita dei carichi di lavoro basati su AI richiede un’infrastruttura di rete ottimizzata. Google Cloud introduce RDMA (Remote Direct Memory Access) per comunicazioni GPU-to-GPU ad alta velocità e topologie non-blocking che garantiscono trasmissione lossless con RoCEv2. L’integrazione con GKE Inference Gateway consente di scalare in modo sicuro le inferenze dei modelli, mentre Private Service Connect isola i flussi sensibili e VPC Service Controls previene esfiltrazioni di dati. L’ecosistema si completa con il Cross-Cloud Network, che collega infrastrutture ibride e multi-cloud, e con Hyperdisk ML, che ottimizza la latenza dello storage per addestramento e inferenza. L’intelligenza artificiale di rete, alimentata da Gemini for Google Cloud, automatizza la diagnosi dei colli di bottiglia e suggerisce ottimizzazioni in linguaggio naturale, anticipando problemi e migliorando l’efficienza operativa.

Rollback sicuro in Kubernetes 1.33

Google Cloud estende la propria leadership nel mondo open-source con l’introduzione della funzione di rollback di versione minor in Kubernetes 1.33, una delle innovazioni più attese per la gestione di cluster mission-critical. Questa capacità riduce i rischi di aggiornamento consentendo un rollback binario sicuro in due fasi, che mantiene la versione emulata del cluster durante la validazione dello stato di salute, evitando corruzioni dei dati e downtime prolungati.

image 145
Google Cloud migliora Vertex AI Agent Builder, Memorystore for Valkey, Workload Manager e Kubernetes 15

La funzione, testata in collaborazione con la community open-source e resa disponibile su GKE, introduce anche un sistema di Mixed Version Proxy per la compatibilità temporanea tra componenti, un Leader Election coordinato e un Component Health SLI per analisi granulari delle performance. L’obiettivo è garantire aggiornamenti più frequenti e sicuri, favorendo la modernizzazione continua delle infrastrutture AI e cloud-native.

Verso un ecosistema integrato, sicuro e sostenibile

Con questi aggiornamenti, Google Cloud consolida la sua visione di un ecosistema scalabile, intelligente e sostenibile, dove l’intelligenza artificiale, la sicurezza e la governance finanziaria convergono in un modello unico di gestione del cloud. L’integrazione tra strumenti come Vertex AI Agent Builder, Memorystore for Valkey e Workload Manager non solo potenzia la produttività, ma rappresenta anche un passo avanti verso infrastrutture self-healing e zero downtime. L’approccio unisce innovazione tecnologica e responsabilità ambientale, in linea con la missione di Google di costruire un cloud più sicuro e sostenibile per imprese e sviluppatori di tutto il mondo.