OpenAI ritira la voce Standard di ChatGPT e scoppia la polemica

ChatGPT Voice mode.
(Immagine:: Shutterstock/Rokas Tenys)

La voce che gli utenti hanno imparato ad associare a ChatGPT andrà in pensione il prossimo 9 settembre, e non tutti hanno accolto bene la notizia. La “Standard Voice” verrà infatti sostituita dall’opzione “Advanced Voice”, introdotta inizialmente per un numero limitato di utenti lo scorso anno. Rinominata semplicemente “ChatGPT Voice”, sarà l’unica disponibile in futuro.

La modalità “Standard” aveva debuttato nel 2023, basata su un sistema relativamente semplice: l’utente parlava, i server di OpenAI trascrivevano l’audio, il modello GPT generava una risposta e questa veniva riprodotta tramite una voce sintetica neutrale.

La nuova “Advanced Voice Mode” è stata progettata per rispondere più velocemente, con un tono e un modo di parlare più simile a quello umano, offrendo in generale prestazioni più elevate rispetto al predecessore. Tuttavia, non tutti sono convinti che si tratti di un passo avanti.

«La voce standard offre calore, profondità e una connessione naturale che la voce avanzata semplicemente non riesce a eguagliare», ha scritto un utente sul forum di OpenAI. «Quella avanzata appare più robotica e distaccata, priva di quel tono empatico e comprensivo che apprezzo».

«La Standard Voice è riflessiva, con un timbro e un ritmo naturali e rassicuranti. Tocca le corde giuste», ha commentato un utente su Reddit. «La Advanced Voice non ha le stesse caratteristiche: non offre risposte ponderate, ha limiti di contenuto più restrittivi e sembra sempre affrettata nel fornire repliche mediocri».

Advanced voices

Anche chi non ha problemi con il nuovo timbro vocale di ChatGPT si è detto infastidito, perché la nuova modalità non funziona allo stesso modo della precedente.

La Advanced Voice Mode integra la voce dell’utente, le risposte dell’IA e l’espressione vocale in un unico processo in tempo reale. Questo significa che l’IA non legge più alla lettera la risposta scritta, ma la riformula in modo più colloquiale: a volte salta frasi, condensa concetti o adatta il tono in base al contesto. Tecnicamente impressionante, certo, ma non quello che alcuni utenti desideravano.

«La Standard Voice leggeva esattamente la risposta che ChatGPT avrebbe dato in forma scritta. Era una linea diretta, capite?» ha scritto un utente su Reddit. «Questa nuova invece sembra parafrasare o riassumere. Salta i dettagli e rende la conversazione molto più distante».

Potrebbe sembrare un dettaglio minore, ma riflette una tendenza più ampia nel mondo tech: gli utenti spesso reagiscono male a cambiamenti radicali, anche quando sono presentati come miglioramenti.

Non tutti, però, sono contrari alla nuova voce. Alcuni apprezzano la sua rapidità e realismo, oltre al fatto che renda la conversazione più scorrevole. OpenAI ha inoltre promesso ulteriori miglioramenti. Tuttavia, considerando che le lamentele per la rimozione di GPT-4o con l’arrivo di GPT-5 portarono al ritorno del modello precedente, non sarebbe sorprendente vedere anche la Standard Voice Mode fare un ritorno in futuro.

TOPICS

Nato nel 1995 e cresciuto da due genitori nerd, non poteva che essere orientato fin dalla tenera età verso un mondo fatto di videogiochi e nuove tecnologie. Fin da piccolo ha sempre esplorato computer e gadget di ogni tipo, facendo crescere insieme a lui le sue passioni. Dopo aver completato gli studi, ha lavorato con diverse realtà editoriali, cercando sempre di trasmettere qualcosa in più oltre alla semplice informazione. Amante del cioccolato fondente, continua a esplorare nuove frontiere digitali, mantenendo sempre viva la sua curiosità e la sua dedizione al settore.