Tempo di lettura: 2 minuti. OpenAI annuncia l'aggiunta di nuove capacità vocali e basate su immagini a ChatGPT, permettendo conversazioni vocali e ricerche basate su immagini, mentre affronta le preoccupazioni per la sicurezza e limita l'accesso per prevenire usi malevoli."> OpenAI annuncia l'integrazione di funzionalità vocali e immagini in ChatGPT - Matrice Digitale
Connect with us

Tech

OpenAI annuncia l’integrazione di funzionalità vocali e immagini in ChatGPT

Tempo di lettura: 2 minuti. OpenAI annuncia l’aggiunta di nuove capacità vocali e basate su immagini a ChatGPT, permettendo conversazioni vocali e ricerche basate su immagini, mentre affronta le preoccupazioni per la sicurezza e limita l’accesso per prevenire usi malevoli.

Published

on

Tempo di lettura: 2 minuti.

OpenAI ha annunciato l’aggiunta di nuove capacità vocali e basate su immagini a ChatGPT, evolvendo oltre una semplice motore di ricerca basato su testo. Gli utenti potranno ora avere una conversazione vocale con il chatbot, chiedendo, ad esempio, di inventare una storia della buonanotte sul posto con pochi prompt vocali. Inoltre, gli utenti di ChatGPT potranno cercare risposte utilizzando immagini, caricando una foto e chiedendo a ChatGPT di spiegarla o fornire istruzioni per completare un obiettivo.

Caratteristiche Principali

  • Conversazione Vocale: Gli utenti possono chiedere verbalmente a ChatGPT di creare storie o rispondere a domande in forma parlata.
  • Ricerca con Immagini: Gli utenti possono caricare un’immagine e chiedere a ChatGPT di spiegarla o fornire istruzioni.
  • Modello di Testo-Parlato: Alimentato da un nuovo modello che può generare voci umane da testo e pochi secondi di discorso campionato.
  • Partnership con Spotify: Permette ai podcaster di tradurre i loro show in altre lingue mantenendo la loro voce originale.

Dettagli Tecnici

La funzione vocale è alimentata da un nuovo modello di testo-parlato che può generare voci umane da testo e pochi secondi di discorso campionato. OpenAI ha collaborato con attori vocali affermati per creare cinque voci diverse, utilizzando il suo sistema di riconoscimento vocale open source Whisper per trascrivere le espressioni verbali in testo. Spotify è stato svelato come partner di lancio, introducendo una nuova funzione che permette ai podcaster di campionare la loro voce e tradurre i loro show in altre lingue.

Preoccupazioni per la Sicurezza

Tuttavia, OpenAI sta procedendo con cautela per evitare critiche, lavorando specificamente con podcaster selezionati per il lancio e limitando l’accesso a questa tecnologia per prevenire l’uso malevolo, come l’impersonificazione di figure pubbliche o la commissione di frodi.

Disponibilità

Le nuove funzionalità saranno disponibili per gli abbonati Plus ed Enterprise nelle prossime due settimane. La funzione vocale sarà limitata alle app ChatGPT Android e iOS su base beta opt-in inizialmente, mentre la ricerca di immagini sarà disponibile su tutte le piattaforme per impostazione predefinita.