Meta lancia LLaMA, un modello di linguaggio di 65 miliardi di parametri per la ricerca

da Livio Varriale
0 commenti 1 minuti leggi

Meta ha annunciato il lancio di LLaMA (Large Language Model Meta AI), un modello di linguaggio avanzato e accessibile per la ricerca nel campo dell’intelligenza artificiale. Progettato per essere più facile da studiare e utilizzare da parte di ricercatori con risorse limitate, LLaMA mira a democratizzare l’accesso ai modelli di linguaggio di grandi dimensioni.

I vantaggi dei modelli di base più piccoli come LLaMA

LLaMA richiede meno potenza di calcolo e risorse per testare nuovi approcci, validare il lavoro altrui ed esplorare nuovi casi d’uso. I modelli di base come LLaMA vengono addestrati su un vasto insieme di dati non etichettati, il che li rende ideali per l’affinamento in una varietà di compiti. LLaMA sarà disponibile in diverse dimensioni (7B, 13B, 33B e 65B parametri) e verrà condivisa una scheda del modello LLaMA che dettaglia la sua costruzione secondo le pratiche di intelligenza artificiale responsabile.

Superare i limiti dell’accesso ai modelli di linguaggio di grandi dimensioni

L’accesso limitato ai modelli di linguaggio di grandi dimensioni ostacola la ricerca per comprendere come funzionano e migliorarne la robustezza, mitigando problemi noti come pregiudizi, tossicità e generazione di disinformazione. I modelli più piccoli addestrati su più token sono più facili da riaddestrare e perfezionare per casi d’uso specifici.

Affrontare le sfide dei modelli di linguaggio avanzati

LLaMA condivide le sfide di altri modelli di linguaggio avanzati, come pregiudizi, commenti tossici e allucinazioni. Condividendo il codice di LLaMA, i ricercatori possono testare nuovi approcci per limitare o eliminare questi problemi nei modelli di linguaggio di grandi dimensioni. Meta fornirà anche valutazioni sui benchmark per valutare pregiudizi e tossicità del modello, al fine di supportare ulteriori ricerche in questo settore cruciale.

Annunci

Si può anche come

MatriceDigitale.it – Copyright © 2024, Livio Varriale – Registrazione Tribunale di Napoli n° 60 del 18/11/2021. – P.IVA IT10498911212 Privacy Policy e Cookies

Developed with love by Giuseppe Ferrara