Letture consigliate

ChatGPT aggiorna la Voice Mode: ora suona molto più umana (ma non è perfetta)

ChatGPT Voice mode.
(Immagine:: Shutterstock/Rokas Tenys)

Tutti gli utenti di ChatGPT con un piano a pagamento, quindi Plus, Pro, Teams ed Enterprise, hanno appena ricevuto un aggiornamento interessante: la modalità vocale avanzata ora suona molto più naturale e realistica.

Secondo OpenAI, si tratta di un miglioramento significativo che agisce su intonazione, pause ed espressività, rendendo la voce dell’assistente più simile a quella umana. Anche se si tratta di aggiustamenti sottili, sono proprio questi dettagli a fare la differenza nell’illusione di una conversazione naturale: ora ci sono pause per enfasi, variazioni nel tono e una maggiore fluidità nell’esprimere emozioni, dalla compassione al sarcasmo.

Oltre alla voce, è stata migliorata anche la funzione di traduzione simultanea. Basta dire qualcosa come “Puoi tradurre in spagnolo?” e ChatGPT comincerà a tradurre in tempo reale tutto quello che dite, fino a quando non gli direte di smettere. Funzioni simili esistono già in app come Google Translate, ma poter fare tutto direttamente dentro l’app di ChatGPT rende l’esperienza molto più comoda e immediata.

Meglio di prima

Ho provato la Modalità Vocale Avanzata dopo l’aggiornamento, e sì, la differenza si sente subito. Basta chiedere a ChatGPT di dire qualcosa in modo sarcastico per percepire subito il nuovo spettro tonale e il modo in cui sfrutta le pause per rendere l’espressione più naturale.

Per curiosità, ho fatto la stessa richiesta a Gemini Live, ma il risultato non regge il confronto: la voce di ChatGPT trasmette le emozioni in modo molto più convincente.

Vale anche la pena confrontare la qualità della voce tra un account gratuito e uno a pagamento di ChatGPT. La differenza è netta, quasi come ascoltare due sistemi completamente diversi.

Uomo o macchina?

Il nuovo ChatGPT è decisamente più espressivo e naturale, ma non siamo ancora al punto in cui potrebbe davvero ingannare qualcuno facendogli credere di parlare con un essere umano.

Capitano ancora alcune stranezze tipiche delle voci sintetiche, specie usando la Modalità Vocale. OpenAI stessa ha riconosciuto questi limiti, specificando:

“Nei test, abbiamo osservato che questo aggiornamento può talvolta causare lievi cali nella qualità audio, con variazioni inattese di tono e intonazione. Questi problemi sono più evidenti con alcune opzioni vocali. Ci aspettiamo di migliorare la coerenza audio nel tempo.”

C'è anche un avvertimento riguardo alle cosiddette "allucinazioni":

“Inoltre, con questo aggiornamento persistono rare allucinazioni nella Modalità Vocale, che possono generare suoni indesiderati simili a pubblicità, frasi prive di senso o musica di sottofondo. Stiamo indagando attivamente su questi problemi per trovare una soluzione.”

L’aggiornamento è già disponibile: basta toccare l’icona del compositore vocale a destra nel campo di scrittura nell’app di ChatGPT sullo smartphone per provarlo.

TOPICS

Nato nel 1995 e cresciuto da due genitori nerd, non poteva che essere orientato fin dalla tenera età verso un mondo fatto di videogiochi e nuove tecnologie. Fin da piccolo ha sempre esplorato computer e gadget di ogni tipo, facendo crescere insieme a lui le sue passioni. Dopo aver completato gli studi, ha lavorato con diverse realtà editoriali, cercando sempre di trasmettere qualcosa in più oltre alla semplice informazione. Amante del cioccolato fondente, continua a esplorare nuove frontiere digitali, mantenendo sempre viva la sua curiosità e la sua dedizione al settore.