Categorie
Economia

Project Gutenberg lancia 5000 audiolibri gratuiti con l’ausilio della sintesi vocale

Tempo di lettura: 2 minuti. Project Gutenberg, in collaborazione con MIT e Microsoft, ha lanciato circa 5000 audiolibri gratuiti, trasformando migliaia di titoli in audiolibri attraverso la sintesi vocale, marcando un passo significativo verso una maggiore accessibilità nella letteratura.

Tempo di lettura: 2 minuti.

Project Gutenberg, la nota piattaforma di libri aperti, ha trasformato migliaia dei suoi titoli in audiolibri praticamente da un giorno all’altro, utilizzando la sintesi vocale. Questi sono ora disponibili per il download o lo streaming su vari servizi. La selezione potrebbe sembrare un po’ idiosincratica, ma rappresenta comunque una potente dimostrazione di come sia possibile aumentare l’accessibilità nella letteratura.

Il processo di creazione degli audiolibri

Creare un audiolibro attraverso la narrazione tradizionale richiede molto tempo, anche nel migliore dei casi, e naturalmente il lettore deve essere retribuito per il suo tempo, senza dimenticare le questioni di editing e pubblicazione. Per molti titoli, non ha senso finanziario produrre un audiolibro, il che significa che molti titoli più vecchi e più oscuri rimangono difficili da consumare per coloro che preferiscono quel formato.

Project Gutenberg, ovviamente, è dedicato a diffondere la letteratura di dominio pubblico in quanti più formati possibile, e colmare questa lacuna è stato probabilmente nel loro elenco di cose da fare per anni. Ma solo quando hanno collaborato con il MIT e Microsoft sono stati in grado di eseguire il tipo di “magia del codice” necessaria per utilizzare il discorso generato dall’IA per dare vita a questi libri.

Sfide e soluzioni tecniche

Il problema con l’archivio di Project Gutenberg, per quanto prezioso, è che i file non sono uniformemente formattati. Provengono da varie fonti, spesso da processi di riconoscimento ottico dei caratteri pieni di errori, e spesso sono corretti in modo imperfetto dai volontari. Anche se fossero perfetti, non è detto che il formato sarebbe facilmente leggibile da una macchina: si finirebbe con la narrazione di numeri di pagina, note a piè di pagina e altri elementi accessori.

“Ogni e-book in Project Gutenberg è nel suo formato HTML idiosincratico con molti testi che non vorresti sentire letti ad alta voce come tabelle, contenuti, indici, numeri di pagina, ecc. La parte più difficile del progetto è stata estrarre il buon testo da leggere ad alta voce”, ha spiegato Mark Hamilton, co-leader del progetto affiliato con Microsoft e MIT.

Per risolvere questo, hanno progettato un sistema che ha esaminato l’archivio e identificato i file dei libri che erano formattati in modo simile, quindi hanno capito quali di questi gruppi erano meglio adatti per essere letti automaticamente.

Prospettive future

Questa prima serie, essendo un po’ limitata nella sua selezione, è un po’ idiosincratica. “Abbiamo scelto i libri per il primo lotto basandoci su ciò che pensavamo che il parser automatico potesse fare abbastanza bene”, ha continuato Hamilton. “Tuttavia, alcuni buoni titoli chiave sono caduti tra le maglie. Ora che abbiamo il primo lotto fuori, stiamo lavorando per generalizzare il sistema per avvicinarci ai 60.000 libri completi in una futura release”.

Per quanto riguarda la narrazione, il team ha messo insieme diversi strumenti di apprendimento automatico e sintesi vocale che sono migliorati e diventati più accessibili negli ultimi anni. Il risultato è una produzione di audiolibri automatizzata che è arrivata, e in grande scala.

Pronto a supportare l'informazione libera?

Iscriviti alla nostra newsletter // Seguici gratuitamente su Google News
Exit mobile version