Sommario
NVIDIA ha recentemente annunciato il lancio di una nuova GPU di livello enterprise, la NVIDIA H200, progettata specificamente per migliorare le capacità di calcolo dell’intelligenza artificiale generativa e dei grandi modelli linguistici. Questo nuovo hardware si distingue per l’introduzione della memoria HMB3e, una soluzione più veloce e capiente rispetto a quella utilizzata nella precedente GPU NVIDIA H100.
Prestazioni e innovazioni della NVIDIA H200
La NVIDIA H200 rappresenta un significativo passo avanti nel campo dell’intelligenza artificiale. Sebbene sia sostanzialmente simile alla H100, a parte l’aggiornamento della memoria, le migliorie apportate dalla memoria HMB3e sono notevoli. La nuova memoria della GPU H200 offre una larghezza di banda di 4.8 terabyte al secondo e una capacità totale di memoria di 141GB, un netto miglioramento rispetto ai 3.35 terabyte al secondo e 80GB di capacità della H100.
Ian Buck, vicepresidente di hyperscale e HPC di NVIDIA, ha sottolineato l’importanza di questa innovazione: “Con NVIDIA H200, la piattaforma di supercomputing AI leader del settore è diventata ancora più veloce per risolvere alcune delle sfide più importanti del mondo.”
Configurazioni e compatibilità
NVIDIA H200 sarà disponibile in schede server HGX H200 con configurazioni a quattro e otto vie, compatibili con l’hardware e il software dei sistemi HGX H100 attuali. Questa versatilità assicura una transizione agevole per gli utenti esistenti della tecnologia NVIDIA.
Disponibilità e domanda del Mercato
La GPU H200 di NVIDIA dovrebbe essere spedita nel secondo trimestre del 2024. Con la precedente GPU H100, NVIDIA ha incontrato difficoltà nel soddisfare l’alta domanda. Resta da vedere se la H200 incontrerà gli stessi problemi di fornitura, ma NVIDIA sta lavorando con i principali produttori di server e fornitori di servizi cloud per un rilascio nel Q2 2024.
L’Impatto di Gauss e l’Intelligenza Artificiale di Samsung
In altre notizie legate all’AI, Samsung ha annunciato la sua soluzione di intelligenza artificiale generativa e grandi modelli linguistici, Gauss. Questa tecnologia sarà utilizzata come base per la nuova AI on-device della serie Galaxy S24. Una delle prime funzionalità basate sull’AI disponibili per il Galaxy S24 consentirà agli utenti di svolgere conversazioni telefoniche in tempo reale con persone che parlano una lingua diversa.