Ricercatori cinesi sviluppano modelli IA per correggere “allucinazioni”

da Redazione
0 commenti 2 minuti leggi

Un team di scienziati dell’Università di Scienza e Tecnologia della Cina e del YouTu Lab di Tencent ha sviluppato uno strumento per combattere le “allucinazioni” generate dai modelli di intelligenza artificiale (IA).

Annunci

Cos’è l’allucinazione in IA?

L’allucinazione è la tendenza di un modello IA a generare output con un alto livello di fiducia che non sembrano basarsi sulle informazioni presenti nei suoi dati di addestramento. Questo problema è diffuso nella ricerca sui grandi modelli linguistici (LLM) e i suoi effetti sono visibili in modelli come ChatGPT di OpenAI e Claude di Anthropic.

Lo strumento “Woodpecker”

Il team USTC/Tencent ha sviluppato uno strumento chiamato “Woodpecker” che, secondo quanto affermato, è in grado di correggere le allucinazioni nei modelli linguistici multimodali di grandi dimensioni (MLLMs). Questa sottocategoria di IA comprende modelli come GPT-4 (in particolare la sua variante visiva, GPT-4V) e altri sistemi che integrano la visione e/o altri processamenti nella modalità generativa IA insieme alla modellazione del linguaggio basata su testo.

Secondo il documento di ricerca preliminare del team, “Woodpecker” utilizza tre modelli IA separati, oltre all’MLLM corretto per le allucinazioni, per eseguire la correzione delle allucinazioni. Questi includono GPT-3.5 turbo, Grounding DINO e BLIP-2-FlanT5. Insieme, questi modelli funzionano come valutatori per identificare le allucinazioni e istruire il modello corretto a rigenerare il suo output in conformità con i suoi dati.

Il processo di correzione delle allucinazioni utilizzato dai modelli IA che alimentano “Woodpecker” si basa su un processo in cinque fasi che coinvolge “estrazione di concetti chiave, formulazione di domande, convalida della conoscenza visiva, generazione di affermazioni visive e correzione delle allucinazioni”.

Risultati della ricerca

I ricercatori affermano che queste tecniche offrono una maggiore trasparenza e “un miglioramento dell’accuratezza del 30,66%/24,33% rispetto ai modelli di base MiniGPT-4/mPLUG-Owl”. Hanno valutato numerosi MLLMs “pronti all’uso” utilizzando il loro metodo e hanno concluso che “Woodpecker” potrebbe essere “facilmente integrato in altri MLLMs”.

Si può anche come

MatriceDigitale.it – Copyright © 2024, Livio Varriale – Registrazione Tribunale di Napoli n° 60 del 18/11/2021. – P.IVA IT10498911212 Privacy Policy e Cookies

Developed with love by Giuseppe Ferrara