L’evoluzione della Physical AI entra in una nuova fase con le innovazioni presentate da NVIDIA tra il GTC Taipei 2026 e il CVPR 2026 di Denver. Da una parte arriva NemoClaw, blueprint open source progettato per creare ingegneri AI autonomi capaci di orchestrare workflow complessi in ambiti come CAE, EDA, progettazione industriale e simulazione avanzata. Dall’altra, i nuovi lavori di ricerca presentati al CVPR 2026 introducono foundation model e agent skills che migliorano manipolazione robotica, guida autonoma, generazione di dati sintetici e addestramento di agenti embodied. Tecnologie come GraspGen-X, LCDrive, NitroGen, Cosmos 3, Alpamayo 2 Super e il runtime sicuro OpenShell convergono verso un obiettivo comune: costruire agenti capaci di comprendere il mondo fisico, prendere decisioni autonome e operare in ambienti reali mantenendo elevati livelli di sicurezza e affidabilità. Le partnership con aziende come Cadence, Dassault Systèmes, Siemens, Synopsys, Microsoft Surface e numerose startup specializzate dimostrano che queste tecnologie stanno già uscendo dai laboratori di ricerca per entrare nei processi industriali.
Cosa leggere
NemoClaw introduce un framework aperto per ingegneri AI autonomi
Il progetto NemoClaw nasce come blueprint open source destinato allo sviluppo di agenti AI specializzati in workflow di lunga durata. A differenza dei tradizionali assistenti conversazionali, questi agenti devono coordinare attività tecniche articolate che coinvolgono progettazione, simulazione, verifica, ottimizzazione e generazione di report. La piattaforma integra componenti come OpenClaw, Hermes, un model router e le librerie NVIDIA NeMo per il fine-tuning e la personalizzazione dei modelli. Il sistema può essere distribuito su workstation DGX Spark, infrastrutture on-premise o cloud pubblici. L’elemento centrale dell’architettura è OpenShell, runtime open source progettato per controllare in modo granulare l’accesso a file, rete e strumenti software attraverso un modello di sicurezza basato su policy. Questo approccio risponde a una delle principali criticità degli agenti autonomi: la necessità di operare su dati sensibili senza compromettere proprietà intellettuale, progetti industriali o infrastrutture aziendali. In settori come semiconduttori, automotive e aerospace, dove un singolo workflow può coinvolgere settimane di simulazioni e centinaia di file, la possibilità di affidare processi complessi a un agente supervisionato rappresenta un cambiamento sostanziale.
Cadence, Siemens e Synopsys adottano NemoClaw nei flussi EDA

Le prime implementazioni industriali mostrano immediatamente il potenziale della piattaforma. Cadence utilizza NemoClaw per costruire un ingegnere AI dedicato alla progettazione e verifica RTL, capace di orchestrare automaticamente strumenti del framework ChipStack. Nelle dimostrazioni presentate durante il GTC Taipei, il tempo necessario per attività di verifica viene ridotto da settimane a poche ore. Siemens integra il blueprint nel proprio Fuse EDA AI Agent, automatizzando workflow multi-tool utilizzati nella progettazione di semiconduttori, circuiti tridimensionali e PCB. Synopsys applica invece NemoClaw a processi end-to-end che comprendono simulazione termica, meshing e ottimizzazione di sistemi complessi, sfruttando anche integrazioni con Ansys Icepak per il raffreddamento di GPU e infrastrutture ad alte prestazioni. Queste applicazioni dimostrano che gli agenti AI non vengono più utilizzati soltanto per generare codice o rispondere a domande, ma iniziano a coordinare interi processi ingegneristici caratterizzati da elevata complessità computazionale e forte dipendenza da software specializzati.
Dassault Systèmes e le startup ampliano l’ecosistema Physical AI
Anche Dassault Systèmes porta la tecnologia all’interno della propria 3DEXPERIENCE Agentic Platform, creando agenti capaci di operare in ambienti di design, simulazione e manufacturing mantenendo controlli di sicurezza basati su OpenShell. Parallelamente cresce un ecosistema di startup che sfrutta NemoClaw per automatizzare attività altamente specializzate. Flexcompute utilizza il runtime sicuro insieme a Tidy3D e PhotonForge per il design ottico multiphysics, esplorando migliaia di varianti progettuali durante la notte. Luminary sviluppa agenti dedicati al training di modelli fisici, orchestrando generazione dati, selezione algoritmica e riaddestramento automatico. Neural Concept applica il framework al design di motori elettrici, concatenando simulazioni elettromagnetiche, strutturali e NVH. PhysicsX, in collaborazione con Microsoft Surface, automatizza l’intero ciclo di progettazione termica dei laptop. P-1 AI sviluppa l’agente Archie, pensato per la progettazione di sistemi di raffreddamento in data center, mentre SimScale e Synera utilizzano NemoClaw per analisi strutturali e processi industriali avanzati. Queste implementazioni mostrano come il blueprint stia diventando un’infrastruttura comune per agenti ingegneristici verticali.
GraspGen-X porta il grasping robotico nella dimensione zero-shot
Tra le ricerche presentate al CVPR 2026, uno dei progetti più significativi è GraspGen-X, descritto da NVIDIA come il primo foundation model per il grasping robotico in grado di operare senza addestramenti specifici per singoli gripper. Tradizionalmente, ogni nuova configurazione meccanica richiede dataset dedicati e lunghe fasi di training. GraspGen-X supera questo limite imparando principi generali di geometria e contatto applicabili a qualsiasi sistema di presa. Il modello viene addestrato utilizzando oltre 2 miliardi di grasp simulati, generati su migliaia di oggetti e configurazioni sintetiche. Questa quantità di dati sarebbe impossibile da ottenere nel mondo reale. Il risultato è un sistema capace di generare pose di presa affidabili anche per oggetti mai osservati in precedenza. L’integrazione con curoboV2, accelerato da CUDA, consente inoltre di collegare rapidamente la generazione della presa alla pianificazione del movimento. Il progetto rappresenta un passo importante verso robot realmente adattivi, capaci di operare in ambienti non strutturati senza richiedere continui retraining.
LCDrive riduce il costo computazionale della guida autonoma
Nel settore dei veicoli autonomi, LCDrive affronta un problema fondamentale: il costo computazionale del ragionamento. Molti sistemi moderni si basano su processi simili al chain-of-thought testuale, che richiedono una grande quantità di token e risorse hardware. LCDrive sostituisce questo approccio con rappresentazioni latenti compatte che permettono al modello di ragionare in uno spazio numerico molto più efficiente. Il sistema genera possibili azioni, predice l’evoluzione dello scenario e aggiorna iterativamente le decisioni, mantenendo prestazioni comparabili ai modelli basati su linguaggio naturale ma utilizzando circa la metà delle risorse computazionali. Costruito sopra la piattaforma NVIDIA Alpamayo, LCDrive viene addestrato utilizzando dati provenienti da sistemi di guida autonoma già operativi. La riduzione del carico computazionale è particolarmente importante per i veicoli di livello avanzato, dove il ragionamento deve avvenire in tempo reale su hardware embedded con vincoli energetici e termici molto stringenti. Migliorare efficienza e velocità significa aumentare direttamente il margine di sicurezza del sistema.
NitroGen usa i videogiochi per addestrare agenti embodied
Un altro progetto particolarmente innovativo è NitroGen, foundation model basato sull’architettura Isaac GR00T e progettato per addestrare agenti embodied attraverso mondi virtuali. Il modello viene esposto a oltre 1.000 videogiochi e più di 40.000 ore di interazioni, imparando a perseguire obiettivi, esplorare ambienti e adattarsi a situazioni nuove. A differenza degli approcci tradizionali, che richiedono grandi quantità di dati robotici reali, NitroGen sfrutta la varietà estrema dei mondi virtuali per sviluppare capacità generali trasferibili al mondo fisico. I risultati mostrano miglioramenti fino al 52% in scenari low-data rispetto a metodi precedenti. Il progetto viene distribuito in modalità open source tramite GitHub e Hugging Face, ampliando l’ecosistema attorno a Isaac GR00T. Oltre alla robotica, NitroGen apre prospettive per NPC avanzati, companion AI e sistemi capaci di apprendere comportamenti complessi in ambienti dinamici.
Cosmos 3 e le nuove agent skills espandono la Physical AI
NVIDIA accompagna queste ricerche con il rilascio di nuove agent skills basate su Cosmos 3, definito come il primo omnimodel aperto per ragionamento visivo, generazione di mondi sintetici e pianificazione delle azioni. Per il settore automotive vengono introdotte competenze dedicate alla ricostruzione neurale delle scene attraverso strumenti come Omniverse NuRec, InstantNuRec e Harmonizer, che trasformano dati raccolti dalle flotte in ambienti tridimensionali modificabili. AlpaGym collega le policy di guida alla simulazione closed-loop su migliaia di GPU, mentre OmniDreams genera rendering fotorealistici reattivi alle azioni del veicolo. Il nuovo modello Alpamayo 2 Super, con 32 miliardi di parametri, è progettato per ragionare sull’intero stack di guida autonoma e supportare implementazioni di livello 4. Queste tecnologie affrontano uno dei problemi storici dell’autonomous driving: il long-tail degli eventi rari e imprevedibili che non possono essere raccolti facilmente nel mondo reale.
Vision AI e robotica beneficiano di dati sintetici e simulazione avanzata
Le agent skills non si limitano all’automotive. Per i sistemi di Vision AI, NVIDIA introduce strumenti capaci di generare dataset sintetici con anomalie controllate attraverso Cosmos 3, OSMO e Isaac Sim. Le nuove skill permettono di creare immagini di difetti industriali, scenari di ispezione e ambienti complessi per addestrare modelli di rilevamento anomalie in modalità zero-shot o few-shot. Nel settore robotico, l’integrazione con Isaac Sim 6.0 e Isaac Lab automatizza generazione scenari, raccolta dati, validazione e training tramite reinforcement learning. Applicazioni particolarmente interessanti emergono nella sanità grazie a Cosmos-H-Surgical-Simulator, progettato per generare dati realistici per la robotica chirurgica. Questi strumenti riducono drasticamente il gap sim-to-real, uno dei principali ostacoli allo sviluppo di robot capaci di operare in ambienti reali complessi.
NVIDIA unisce agenti autonomi e Physical AI in una piattaforma integrata
Le novità presentate da NVIDIA tra GTC Taipei 2026 e CVPR 2026 delineano una strategia coerente che unisce infrastrutture industriali, simulazione avanzata, foundation model e agenti autonomi. NemoClaw affronta il problema della sicurezza e dell’orchestrazione nei workflow ingegneristici, mentre GraspGen-X, LCDrive, NitroGen e le nuove agent skills ampliano le capacità cognitive e fisiche degli agenti embodied. La disponibilità di questi strumenti come Physical AI Launchables su piattaforme come Brev con GPU H100 accelera ulteriormente l’adozione da parte di aziende, università e centri di ricerca. L’obiettivo finale è costruire sistemi in grado di comprendere il mondo fisico, prendere decisioni autonome e collaborare con esseri umani in ambienti reali. Se le precedenti generazioni di AI hanno trasformato l’elaborazione del linguaggio e delle informazioni digitali, la combinazione di NemoClaw e delle ricerche CVPR 2026 indica che la prossima frontiera sarà l’autonomia operativa nel mondo fisico, con agenti e robot capaci di apprendere, simulare, ragionare e agire su scala industriale.
Iscriviti alla Newsletter
Non perdere le analisi settimanali: Entra nella Matrice Digitale.
Matrice Digitale partecipa al Programma Affiliazione Amazon EU. In qualità di Affiliato Amazon, ricevo un guadagno dagli acquisti idonei. Questo non influenza i prezzi per te.









