Sommario
Meta ha annunciato il lancio di Llama 2, un modello di linguaggio auto-regressivo che utilizza un’architettura transformer ottimizzata. Questo modello è destinato all’uso commerciale e alla ricerca in inglese e viene fornito in una serie di dimensioni di parametri: 7 miliardi, 13 miliardi e 70 miliardi, oltre a variazioni pre-addestrate e ottimizzate.”
Caratteristiche di Llama 2
Llama 2 è stato pre-addestrato su 2 trilioni di token di dati provenienti da fonti pubblicamente disponibili. Le versioni ottimizzate utilizzano l’ottimizzazione supervisionata (SFT) e l’apprendimento per rinforzo con feedback umano (RLHF) per allinearsi alle preferenze umane per utilità e sicurezza.
Llama 2 si differenzia dal suo predecessore, Llama, in vari modi. Viene fornito in due varianti, Llama 2 e Llama 2-Chat, quest’ultimo ottimizzato per conversazioni bidirezionali. Entrambi vengono ulteriormente suddivisi in versioni di varia complessità: 7 miliardi di parametri, 13 miliardi di parametri e 70 miliardi di parametri.
Llama 2: un cambiamento nel panorama dell’IA generativa
L’annuncio di Llama 2 segna un cambiamento significativo nel panorama dell’IA generativa. A differenza del suo predecessore, Llama, che era disponibile solo su richiesta a causa delle preoccupazioni per un possibile uso improprio, Llama 2 sarà disponibile per la messa a punto su AWS, Azure e la piattaforma di hosting di modelli di IA di Hugging Face in forma pre-addestrata.
Disponibilità di Llama 2 su Amazon SageMaker
Ora è possibile scoprire e implementare Llama 2 con pochi clic in Amazon SageMaker Studio o programmaticamente attraverso il SDK Python di SageMaker. Questo permette di ottenere prestazioni del modello e controlli MLOps con funzionalità di SageMaker come Amazon SageMaker Pipelines, Amazon SageMaker Debugger o registri dei container.
L’arrivo di Llama 2 rappresenta un passo avanti significativo nel campo dell’IA generativa. Con l’accesso a modelli di base Llama 2 che contengono miliardi di parametri, i modelli di base pre-addestrati possono aiutare a ridurre i costi di addestramento e infrastruttura e consentire la personalizzazione per il tuo caso d’uso.