Et si une IA lisait vos livres audio ?

Un écran de téléphone montrant un Apple Book
(Crédit photo: Apple)

Si vous êtes un amateur de livres audio, Apple vient de vous donner un avant-goût du futur en lançant son premier lot de livres narrés par une intelligence artificielle. Mais si l'initiative est fascinante et a de grandes implications, le ton robotique des narrateurs montre que les voix humaines, tant appréciées, sont encore là pour un certain temps.

Vous pouvez trouver les livres audio lus par une IA, via l'utilisation du système texte-voix, dans l'application Apple Books en recherchant "narration IA". Vous obtiendrez ainsi une liste de livres d'amour ou de fiction (gratuits ou payants) accompagnés de la description "narré par Apple Books". 

Apple Books propose deux types de voix d'IA - une soprano appelée Madison et une voix de baryton appelée Jackson - qui ont toutes les deux un accent américain et ne s'expriment actuellement qu'en anglais. Vous pouvez avoir un avant-goût de leur sonorité en appuyant sur le bouton "aperçu" sous l'un des titres racontés par Apple Books.

Un écran de tablette montrant les narrateurs de livres audio IA d'Apple

(Image credit: Apple)

Pour l'instant, les deux voix IA d'Apple ont indéniablement une tonalité robotique et artificielle. Vous ne les confondrez pas de sitôt avec les tons chauds et expressifs de narrateurs populaires comme Stephen Fry ou Julia Whelan. Mais si la tonalité de la voix reste un obstacle difficile à franchir pour les narrateurs IA, il ne fait aucun doute qu'ils sont en bonne voie de séduire nos oreilles.

Naturellement, Apple affirme (s'ouvre dans un nouvel onglet) que ses voix IA ont été développées pour rendre les livres audio "plus accessibles à tous". Mais elles rendent également l'industrie multimilliardaire du livre audio plus accessible au géant de la technologie. Et la nouvelle fonctionnalité Apple Books n'est que le début d'une bataille féroce avec Amazon et Spotify pour gagner nos oreilles d'amateurs de livres audio.

Des problèmes de voix

Pour l'instant, nous verrons surtout les narrateurs IA limités aux livres des petits éditeurs indépendants. Cette évolution pourrait provoquer une explosion du nombre de livres audio disponibles pour les lecteurs sur tous les appareils, car la narration numérique ouvre un nouveau marché aux éditeurs et aux auteurs qui, jusqu'à présent, n'avaient pas les moyens de passer de l'imprimé à l'audio.

Mais la réticence des grands éditeurs et des acteurs vocaux pourrait également ralentir l'essor des robot-narrateurs. Les lecteurs électroniques Kindle d'Amazon ont officiellement perdu leur fonction de synthèse vocale il y a plusieurs années, même s'il existe des solutions de contournement dans les menus d'accessibilité. Cette décision est due, du moins en partie, à des problèmes de droits d'auteur et au fait que les livres audio sont légalement considérés comme des œuvres d'art distinctes.

Audible, qui appartient à Amazon, a aussi longuement écrit (s'ouvre dans un nouvel onglet) sur les types de narrateurs qui conviennent aux différents styles de livres et sur la manière dont les éditeurs choisissent les bons. Son blog indique que "l'aspect le plus important en matière de livres audio est que la voix corresponde au ton et au genre du livre". Cet objectif est quelque peu difficile à atteindre si, comme Apple Books, vous ne disposez que de deux voix.

Un iPhone affichant une liste de titres dans Apple Books

(Image credit: Apple)

Audible précise également que "les doubleurs expérimentés sont capables capter l'attention des auditeurs en jouant sur la hauteur, l'intonation, le volume et les accents". C'est certainement dans ce domaine que les lecteurs IA doivent suivre une formation vocale intense, et peut-être aussi prendre des cours du soir sur la mise en avant des émotions.

Mais la nouvelle fonctionnalité Apple Books n'est manifestement que le début d'un boom inévitable de la technologie vocale de l'IA. Et le grand moment pour les livres audio pourrait être celui où l'IA pourra, au lieu de lire un script de manière robotique, imiter de manière convaincante un acteur vocal célèbre - une avancée qui n'est peut-être pas si lointaine, si l'on en croit les récentes présentations de sociétés comme Amazon.

L'empire du faux

Après tout, les "deepfakes" ne se limitent pas aux vidéos effroyablement convaincantes d'un Morgan Freeman (s'ouvre dans un nouvel onglet) ou d'un Tom Cruise (s'ouvre dans un nouvel onglet) de synthèse : les technologies vocales alimentées par l'IA se développent aussi rapidement.

Des applications web virales comme Uberduck (s'ouvre dans un nouvel onglet)vous permettent de générer des discours avec la voix d'anciens présidents ou de personnages de dessins animés, tandis que l'année dernière, Amazon a présenté (s'ouvre dans un nouvel onglet) une nouvelle compétence Alexa légèrement terrifiante qui pouvait lire le Magicien d'Oz à un enfant avec la voix de sa grand-mère.

Avec des entreprises comme Google Wavenet (s'ouvre dans un nouvel onglet) qui font également progresser la technologie, les voix de l'IA ne peuvent que devenir plus convaincantes. Pour l'instant, les obstacles à l'adoption généralisée de l'IA dans le domaine des livres audio seront probablement d'ordre juridique et éthique, plutôt que technologique. Mais les narrateurs artificiels d'Apple Books sont le son de notre avenir synthétique - et dans un avenir pas si lointain, les narrateurs vocaux célèbres seront probablement eux aussi soumis à des droits d'auteur et à des licences pour leurs propres voix.

Pour l'instant, les données d'Apple Books suggèrent que ces voix d'IA sont mieux adaptées aux ouvrages documentaires et factuels qu'aux récits émouvants. Pour les romans, tout comme pour les films, nous sommes encore loin de voir des acteurs artificiels capables de faire vibrer notre corde sensible de manière convaincante sans gâcher le suspense par une inflexion robotique ou une note plate. Mais un torrent de livres audio lus par l'IA est à venir, quoi qu'il en soit.

Mark Wilson
Senior news editor

Mark is TechRadar's Senior news editor. Having worked in tech journalism for a ludicrous 17 years, Mark is now attempting to break the world record for the number of camera bags hoarded by one person. He was previously Cameras Editor at Trusted Reviews, Acting editor on Stuff.tv, as well as Features editor and Reviews editor on Stuff magazine. As a freelancer, he's contributed to titles including The Sunday Times, FourFourTwo and Arena. And in a former life, he also won The Daily Telegraph's Young Sportswriter of the Year. But that was before he discovered the strange joys of getting up at 4am for a photo shoot in London's Square Mile.