Sommario
Un team di scienziati dell’Università di Scienza e Tecnologia della Cina e del YouTu Lab di Tencent ha sviluppato uno strumento per combattere le “allucinazioni” generate dai modelli di intelligenza artificiale (IA).
Cos’è l’allucinazione in IA?
L’allucinazione è la tendenza di un modello IA a generare output con un alto livello di fiducia che non sembrano basarsi sulle informazioni presenti nei suoi dati di addestramento. Questo problema è diffuso nella ricerca sui grandi modelli linguistici (LLM) e i suoi effetti sono visibili in modelli come ChatGPT di OpenAI e Claude di Anthropic.
Lo strumento “Woodpecker”
Il team USTC/Tencent ha sviluppato uno strumento chiamato “Woodpecker” che, secondo quanto affermato, è in grado di correggere le allucinazioni nei modelli linguistici multimodali di grandi dimensioni (MLLMs). Questa sottocategoria di IA comprende modelli come GPT-4 (in particolare la sua variante visiva, GPT-4V) e altri sistemi che integrano la visione e/o altri processamenti nella modalità generativa IA insieme alla modellazione del linguaggio basata su testo.
Secondo il documento di ricerca preliminare del team, “Woodpecker” utilizza tre modelli IA separati, oltre all’MLLM corretto per le allucinazioni, per eseguire la correzione delle allucinazioni. Questi includono GPT-3.5 turbo, Grounding DINO e BLIP-2-FlanT5. Insieme, questi modelli funzionano come valutatori per identificare le allucinazioni e istruire il modello corretto a rigenerare il suo output in conformità con i suoi dati.
Il processo di correzione delle allucinazioni utilizzato dai modelli IA che alimentano “Woodpecker” si basa su un processo in cinque fasi che coinvolge “estrazione di concetti chiave, formulazione di domande, convalida della conoscenza visiva, generazione di affermazioni visive e correzione delle allucinazioni”.
Risultati della ricerca
I ricercatori affermano che queste tecniche offrono una maggiore trasparenza e “un miglioramento dell’accuratezza del 30,66%/24,33% rispetto ai modelli di base MiniGPT-4/mPLUG-Owl”. Hanno valutato numerosi MLLMs “pronti all’uso” utilizzando il loro metodo e hanno concluso che “Woodpecker” potrebbe essere “facilmente integrato in altri MLLMs”.