Categorie
Robotica

Clio permette ai robot di concentrarsi sugli oggetti di interesse

Clio è un sistema sviluppato dal MIT che aiuta i robot a focalizzarsi sugli oggetti rilevanti per un compito specifico, semplificando la navigazione e l’esecuzione delle attività.

Gli ingegneri del MIT hanno sviluppato una nuova tecnologia chiamata Clio, progettata per permettere ai robot di identificare e focalizzarsi solo sugli oggetti di un ambiente che sono rilevanti per i compiti che devono svolgere. Grazie a Clio, i robot possono “capire” quali elementi di una scena sono importanti, memorizzandoli in base alle richieste di un determinato compito, senza la necessità di interpretare l’intera scena in dettaglio.

Come funziona Clio

Clio utilizza avanzate tecniche di computer vision e modelli di linguaggio naturale. Quando un robot riceve un elenco di compiti, Clio aiuta il robot a determinare il livello di dettaglio necessario per completare quelle specifiche attività. Per esempio, se il compito è “spostare un rack di riviste”, Clio si focalizzerà sul rack intero. Se, invece, il compito è “prendere il primo soccorso”, il robot ignorerà tutto il resto dell’ambiente tranne il kit di pronto soccorso.

Il sistema lavora in tempo reale, utilizzando algoritmi per segmentare una scena e identificare gli elementi visivamente rilevanti per il compito specifico. Ad esempio, quando un robot con Clio esplora un edificio, si focalizzerà solo sugli oggetti che sono funzionali al suo compito, come individuare un giocattolo per cani e ignorare gli altri oggetti presenti.

Applicazioni di Clio in scenari reali

In diversi esperimenti condotti in ambienti reali, come un ufficio e un edificio di cinque piani nel campus del MIT, Clio ha dimostrato di poter segmentare scene a vari livelli di dettaglio in base ai compiti descritti in linguaggio naturale. Questo consente al robot di creare una mappa semplificata degli oggetti necessari, permettendogli di eseguire il compito con efficienza.

In uno scenario di “search and rescue” (ricerca e salvataggio), il sistema Clio può aiutare un robot a trovare oggetti essenziali, come strumenti di sopravvivenza o altre persone. Ma le potenziali applicazioni vanno oltre il salvataggio, estendendosi a contesti come la robotica domestica o l’automazione industriale, dove Clio può aiutare i robot a comprendere e navigare nei loro ambienti con precisione.

La tecnologia di Clio

La tecnologia di Clio si basa su avanzati modelli di deep learning, addestrati su milioni di immagini e testi open-source per aiutare a identificare oggetti comuni. Inoltre, Clio adotta il concetto di “information bottleneck” dall’informazione teorica, che consente di ridurre la quantità di dati da memorizzare solo agli elementi più rilevanti per il compito.

Il team del MIT ha testato Clio in vari contesti, inclusa una sperimentazione “no-nonsense” in un appartamento disordinato, dimostrando come Clio sia in grado di individuare rapidamente gli oggetti rilevanti per i compiti specifici, come “spostare un mucchio di vestiti”. Clio è stata testata anche in tempo reale su un robot quadrupede, in cui ha elaborato scene e segmentato oggetti in tempo reale mentre il robot esplorava un edificio.

Futuro di Clio

Gli sviluppatori mirano ad estendere le capacità di Clio a compiti di livello superiore, consentendo ai robot di rispondere a comandi più complessi e astratti, come “trova i superstiti” o “ripristina la corrente”. L’obiettivo è arrivare a una comprensione più umana e sofisticata delle scene e dei compiti da svolgere.

Di Lorenzo De Santis matricedigitale.it

Sono uno psicologo clinico specializzando in psicoterapia sistemica familiare. Mi occupo di attività di orientamento scuola-università, mentoring scolastico e terapie individuali/coppia/familiari. Appassionato di intelligenza artificiale e reti neurali.

Exit mobile version