Categorie
Sicurezza Informatica

Stable Video Diffusion trasforma immagini in Video con l’AI

Tempo di lettura: 2 minuti.

Stability AI ha recentemente lanciato Stable Video Diffusion, uno strumento di ricerca AI gratuito che trasforma immagini fisse in brevi video. Questa innovazione rappresenta un passo avanti significativo nel campo della sintesi video AI, sebbene sia ancora in una fase iniziale. Esaminiamo le caratteristiche, le potenzialità e i limiti di questa tecnologia emergente.

L’Evoluzione della Sintesi Video AI

Dopo il successo di Stable Diffusion, un modello di sintesi di immagini “open weights”, Stability AI ora punta a rivoluzionare la sintesi video AI. Stable Video Diffusion comprende due modelli: SVD, che produce sintesi immagine-video di 14 fotogrammi, e SVD-XT, che genera 25 fotogrammi. Questi modelli possono operare a velocità variabili da 3 a 30 fotogrammi al secondo, producendo clip video MP4 di breve durata (tipicamente 2-4 secondi) a una risoluzione di 576×1024.

Test e Limitazioni di Stable Video Diffusion

https://www.matricedigitale.it/wp-content/uploads/2023/11/replicate-prediction-cfsolidbokgwpwhtmrogvi6qjq.mp4

Nei test locali, la generazione di un video di 14 fotogrammi ha richiesto circa 30 minuti su una scheda grafica Nvidia RTX 3060. Gli utenti possono sperimentare l’esecuzione dei modelli più velocemente sul cloud tramite servizi come Hugging Face e Replicate. Le animazioni generate tendono a mantenere una parte della scena statica, aggiungendo effetti di panoramica e zoom o animando elementi come fumo o fuoco. Tuttavia, le persone raffigurate nelle foto spesso non si muovono.

Ricerca e Sviluppi Futuri

Stability AI sottolinea che il modello è ancora in fase iniziale e destinato solo alla ricerca. La società sta lavorando anche su un modello di testo-video, che consentirà la creazione di brevi clip video utilizzando prompt scritti anziché immagini. Il dataset di addestramento utilizzato per questi modelli, denominato Large Video Dataset (LVD), comprende circa 580 milioni di clip video annotate, che coprono 212 anni di contenuti.

Confronto con altri Modelli AI di Sintesi Video

Stable Video Diffusion non è il primo modello AI a offrire questa funzionalità. Altri metodi di sintesi video AI sono stati sviluppati da aziende come Meta, Google e Adobe, ma tuttavia si distingue per la sua accessibilità e il potenziale di sviluppo comunitario, essendo disponibile su GitHub.

Stable Video Diffusion rappresenta un passo importante nel campo della sintesi video AI. Sebbene sia ancora in una fase iniziale e con alcune limitazioni, il suo sviluppo apre nuove possibilità nel campo della creazione di contenuti digitali e potrebbe avere applicazioni significative in futuro.

Pronto a supportare l'informazione libera?

Iscriviti alla nostra newsletter // Seguici gratuitamente su Google News
Exit mobile version