Voci AI deepfake: ora sono indistinguibili dalla realtà
Il costo per creare deepfake vocali realistici è ora incredibilmente basso
Sign up for breaking news, reviews, opinion, top tech deals, and more.
You are now subscribed
Your newsletter sign-up was successful
- La tecnologia vocale AI ora imita la voce umana in modo così convincente che è quasi impossibile distinguerla
- Creare un clone vocale convincente richiede solo pochi minuti e competenze minime
- Alcune voci sintetiche sono state giudicate più affidabili delle registrazioni umane reali
Per anni si è dato per scontato che le voci generate dall'intelligenza artificiale potessero essere sempre riconosciute per il loro tono leggermente "artificiale".
Una nuova ricerca della Queen Mary University di Londra mette in discussione questa convinzione, dimostrando che l'attuale tecnologia vocale AI ha raggiunto un livello in cui i "cloni vocali" e i deepfake sono quasi indistinguibili dalle registrazioni reali.
Nello studio, i partecipanti hanno confrontato voci umane con due forme di audio sintetico: voci clonate progettate per imitare parlanti reali e voci generate da un sistema LLM senza controparti specifiche.
Oltre il realismo, verso il dominio
I partecipanti hanno faticato a distinguere tra le due tipologie, suggerendo che la tecnologia è entrata in una fase in cui il realismo simile a quello umano non è più un'aspirazione, ma una realtà. Il team di ricerca ha indagato non solo se i partecipanti riuscissero a distinguere tra voci sintetiche e reali, ma anche come le percepissero. Sorprendentemente, entrambi i tipi di voci generate dall'AI sono stati valutati come più dominanti rispetto a quelle umane e, in alcuni casi, sono stati giudicati più affidabili. La dott.ssa Nadine Lavan, docente di Psicologia alla Queen Mary University di Londra, ha sottolineato la facilità e il basso costo con cui il suo team ha creato questi cloni vocali. "Le voci generate dall'AI sono ormai ovunque, era solo questione di tempo prima che la tecnologia AI iniziasse a produrre un parlato naturalistico e dal suono umano. Il processo ha richiesto una competenza minima, solo pochi minuti di registrazioni vocali e quasi nessun investimento economico", ha dichiarato. Ha aggiunto che la facilità d'uso dimostra quanto la tecnologia sia progredita in poco tempo. Questa accessibilità crea opportunità in settori come l'istruzione, la comunicazione e l'accessibilità, dove voci sintetiche personalizzate potrebbero migliorare il coinvolgimento e la portata.
Proprio come gli scrittori AI sollevano questioni su originalità, copyright e abuso, la generazione vocale AI pone interrogativi sulla proprietà dell'identità e sul consenso.
Mentre gli strumenti AI continuano ad espandersi in capacità e accessibilità, la sfida sarà garantire che i benefici si realizzino senza aprire nuove vie all'inganno.
Iscriviti alla newsletter di Techradar Pro per ricevere tutte le ultime notizie, opinioni, editoriali e guide per il successo della tua impresa!

Efosa has been writing about technology for over 7 years, initially driven by curiosity but now fueled by a strong passion for the field. He holds both a Master's and a PhD in sciences, which provided him with a solid foundation in analytical thinking.