OpenAI annuncia l'integrazione di funzionalità vocali e immagini in ChatGPT -

OpenAI ha annunciato l’aggiunta di nuove capacità vocali e basate su immagini a ChatGPT, evolvendo oltre una semplice motore di ricerca basato su testo. Gli utenti potranno ora avere una conversazione vocale con il chatbot, chiedendo, ad esempio, di inventare una storia della buonanotte sul posto con pochi prompt vocali. Inoltre, gli utenti di ChatGPT potranno cercare risposte utilizzando immagini, caricando una foto e chiedendo a ChatGPT di spiegarla o fornire istruzioni per completare un obiettivo.

Cosa leggere

Caratteristiche Principali

Conversazione Vocale: Gli utenti possono chiedere verbalmente a ChatGPT di creare storie o rispondere a domande in forma parlata.
Ricerca con Immagini: Gli utenti possono caricare un’immagine e chiedere a ChatGPT di spiegarla o fornire istruzioni.
Modello di Testo-Parlato: Alimentato da un nuovo modello che può generare voci umane da testo e pochi secondi di discorso campionato.
Partnership con Spotify: Permette ai podcaster di tradurre i loro show in altre lingue mantenendo la loro voce originale.

Dettagli Tecnici

La funzione vocale è alimentata da un nuovo modello di testo-parlato che può generare voci umane da testo e pochi secondi di discorso campionato. OpenAI ha collaborato con attori vocali affermati per creare cinque voci diverse, utilizzando il suo sistema di riconoscimento vocale open source Whisper per trascrivere le espressioni verbali in testo. Spotify è stato svelato come partner di lancio, introducendo una nuova funzione che permette ai podcaster di campionare la loro voce e tradurre i loro show in altre lingue.

Preoccupazioni per la Sicurezza

Tuttavia, OpenAI sta procedendo con cautela per evitare critiche, lavorando specificamente con podcaster selezionati per il lancio e limitando l’accesso a questa tecnologia per prevenire l’uso malevolo, come l’impersonificazione di figure pubbliche o la commissione di frodi.

Disponibilità

Le nuove funzionalità saranno disponibili per gli abbonati Plus ed Enterprise nelle prossime due settimane. La funzione vocale sarà limitata alle app ChatGPT Android e iOS su base beta opt-in inizialmente, mentre la ricerca di immagini sarà disponibile su tutte le piattaforme per impostazione predefinita.

Iscriviti alla Newsletter

Non perdere le analisi settimanali: Entra nella Matrice Digitale.

Matrice Digitale partecipa al Programma Affiliazione Amazon EU. In qualità di Affiliato Amazon, ricevo un guadagno dagli acquisti idonei. Questo non influenza i prezzi per te.

Caratteristiche Principali

Dettagli Tecnici

Preoccupazioni per la Sicurezza

Disponibilità

Iscriviti alla Newsletter

Leggi anche