Tech
OpenAI annuncia l’integrazione di funzionalità vocali e immagini in ChatGPT
Tempo di lettura: 2 minuti. OpenAI annuncia l’aggiunta di nuove capacità vocali e basate su immagini a ChatGPT, permettendo conversazioni vocali e ricerche basate su immagini, mentre affronta le preoccupazioni per la sicurezza e limita l’accesso per prevenire usi malevoli.
OpenAI ha annunciato l’aggiunta di nuove capacità vocali e basate su immagini a ChatGPT, evolvendo oltre una semplice motore di ricerca basato su testo. Gli utenti potranno ora avere una conversazione vocale con il chatbot, chiedendo, ad esempio, di inventare una storia della buonanotte sul posto con pochi prompt vocali. Inoltre, gli utenti di ChatGPT potranno cercare risposte utilizzando immagini, caricando una foto e chiedendo a ChatGPT di spiegarla o fornire istruzioni per completare un obiettivo.
Caratteristiche Principali
- Conversazione Vocale: Gli utenti possono chiedere verbalmente a ChatGPT di creare storie o rispondere a domande in forma parlata.
- Ricerca con Immagini: Gli utenti possono caricare un’immagine e chiedere a ChatGPT di spiegarla o fornire istruzioni.
- Modello di Testo-Parlato: Alimentato da un nuovo modello che può generare voci umane da testo e pochi secondi di discorso campionato.
- Partnership con Spotify: Permette ai podcaster di tradurre i loro show in altre lingue mantenendo la loro voce originale.
Dettagli Tecnici
La funzione vocale è alimentata da un nuovo modello di testo-parlato che può generare voci umane da testo e pochi secondi di discorso campionato. OpenAI ha collaborato con attori vocali affermati per creare cinque voci diverse, utilizzando il suo sistema di riconoscimento vocale open source Whisper per trascrivere le espressioni verbali in testo. Spotify è stato svelato come partner di lancio, introducendo una nuova funzione che permette ai podcaster di campionare la loro voce e tradurre i loro show in altre lingue.
Preoccupazioni per la Sicurezza
Tuttavia, OpenAI sta procedendo con cautela per evitare critiche, lavorando specificamente con podcaster selezionati per il lancio e limitando l’accesso a questa tecnologia per prevenire l’uso malevolo, come l’impersonificazione di figure pubbliche o la commissione di frodi.
Disponibilità
Le nuove funzionalità saranno disponibili per gli abbonati Plus ed Enterprise nelle prossime due settimane. La funzione vocale sarà limitata alle app ChatGPT Android e iOS su base beta opt-in inizialmente, mentre la ricerca di immagini sarà disponibile su tutte le piattaforme per impostazione predefinita.