Mobilité

Votre prochain livre audio sera-t-il lu par une IA ?

Votre prochain livre audio sera-t-il lu par une IA ?


Les

livres audio
sont en plein essor. Selon

Acumen Research and Consulting
, le marché devrait atteindre 33,5 milliards de dollars d’ici 2030, contre
4,2 milliards de dollars en 2021. Qu’il s’agisse d’une conséquence de la
popularité croissante des podcasts, d’une question de commodité d’écoute ou
d’un effet de la pandémie, ce phénomène n’a pas échappé à l’attention des
entreprises technologiques et à la progression inévitable de l’intelligence
artificielle (IA).


En 2023, l’emballement autour du potentiel de l’IA est grand, mais
l’inquiétude qu’elle détruise les emplois de créatifs en difficulté l’est
tout autant.

ChatGPT
peut rédiger toutes sortes de textes, avec plus ou moins de succès. Des
plateformes comme Lensa AI et

Dall-E
d’OpenAI produisent des œuvres d’art générées par l’IA, ce qui amène de
nombreux créateurs d’art numérique à s’inquiéter de leur avenir.


Des entreprises technologiques telles qu’Apple et Google travaillent depuis
un certain temps déjà sur la narration de livres audio par l’IA. En 2022,
Google a proposé ses services aux éditeurs de six pays, dont les États-Unis
et le Canada. Les narrateurs IA de Google ont des noms comme Archie, qui a
une voix britannique, et Santiago, qui parle espagnol. Au début du mois de
janvier, Apple a présenté un ensemble de voix artificielles dénommées
Madison et Jackson, que les auteurs et les éditeurs indépendants qui
vendent leurs livres sur Apple Books peuvent utiliser pour lire des genres
allant de la non-fiction à la romance.


La présence croissante de l’IA dans la narration des livres audio inquiète
les narrateurs humains «

Je ne sais pas si, dans cinq ans, ce sera encore mon travail à plein
temps

», a déclaré Tanya Eby, narratrice basée à Grand Rapids, dans le Michigan
(Etats-Unis), qui a enregistré plus de 1 000 livres au cours des 21
dernières années. Comme d’autres confères, elle considère que son humanité
est précisément ce qui l’aide à faire ce travail. En particulier dans le
domaine de la fiction, les narrateurs prennent des décisions sur tout, de
la voix d’un personnage à la façon de communiquer les nuances et les
émotions d’une manière qui reflète l’histoire. «

Si un personnage sanglote après la mort de son père, je dois
transmettre ces larmes et ces halètements dans son discours

», explique Kathleen Li, une narratrice basée à Austin, au Texas.

livres audio IA 1 

La narratrice Tanya Eby. © Tanya Eby


L’argent s’en mêle


Les inconditionnels du livre audio peuvent avoir du mal à comprendre
pourquoi quelqu’un opterait pour une voix synthétique plutôt que pour une
voix humaine. Mais pour les petits éditeurs et les auteurs, le temps et
l’argent peuvent constituer un argument plus puissant que le caractère
sacré d’une performance créative.


Par exemple, les livres audio ne rapportent pas beaucoup d’argent aux
Presses de l’Université du Michigan. L’éditeur publie une centaine
d’ouvrages par an, rédigés par des chercheurs pour des chercheurs ou des
étudiants. L’embauche d’un narrateur pour un livre qui ne rapportera que
quelques centaines de dollars peut coûter jusqu’à 6 000 dollars. Et c’est
sans compter l’intensité du processus de production. Selon ACX, l’Audiobook
Creation Exchange d’Amazon, il faut environ six heures pour produire une
heure finie d’un livre audio.


«

La réalité est qu’à moins d’avoir un best-seller, l’économie ne
fonctionne pas

», estime Charles Watkinson, directeur des presses de l’université du
Michigan. Pour les petits auteurs et éditeurs, le temps et le coût de
production d’un livre audio peuvent être hors de portée. L’IA pourrait
changer cela. Il y a environ deux ans, Google a proposé aux Presses de
l’Université du Michigan de participer à un programme pilote et d’utiliser
son outil pour créer une centaine de livres audio numériques.


Au début du projet, un échantillon de la narration a été envoyé à environ
900 auteurs. La qualité a été jugée à peine meilleure que ce qu’un lecteur
d’écran pourrait offrir à une personne malvoyante. Toutefois, pour les
personnes ayant des problèmes de vue et qui ne disposent pas de lecteurs
d’écran ou autres, l’IA pourrait peut-être contribuer à combler une lacune
d’accessibilité.


L’essor des voix numériques


Outre les grands noms comme Apple et Google, un groupe de petites
entreprises se lance dans l’aventure de l’IA vocale. DeepZen est l’une
d’entre elles. Fondée en 2018 et inspirée par le film Her de 2013, qui
raconte l’histoire d’un homme qui tombe amoureux de son assistante
virtuelle, DeepZen a construit un système de traitement du langage naturel
qui peut prendre des repères dans le texte et utilise des voix de synthèse
construites à partir de narrateurs humains qui accordent des licences
d’exploitation sur leur voix. L’un des plus grands défis a été de créer une
plateforme qui ne se contente pas d’interpréter un texte à la lettre, mais
qui lui insuffle un ton, explique Taylan Kamis, PDG et cofondateur de
l’entreprise.


Il a fallu quelques années pour arriver sur le marché, mais aujourd’hui
DeepZen permet aux clients de télécharger un manuscrit et, en fonction de
leur budget, de choisir un service automatisé ou géré. Les deux types de
service comportent des niveaux de contrôle de la qualité, comme une
vérification de la prononciation, mais l’option gérée comprend une
vérification par des rédacteurs humains et deux séries de corrections. Le
service automatisé coûte 69 dollars par heure de travail, contre 129
dollars pour l’option gérée. DeepZen a produit près de 3 000 livres à ce
jour. Sur son site web, vous pouvez écouter des échantillons de 10 voix, avec
des noms comme Todd, Dahlia et Alice.


Pour Taylan Kamis, les licences vocales pourraient être un moyen pour les
narrateurs de coexister avec l’IA. «

Ce narrateur gagnera de l’argent en dormant et sa voix rapportera des
royalties au Japon, en Chine ou en Afrique du Sud

», pense-t-il.


DeepZen travaille également sur un moyen de faire parler les IA dans
d’autres langues, afin d’accroître la portée du marché. Même la mort n’est
pas un obstacle. En effet, DeepZen a contacté la famille du célèbre acteur
et narrateur Edward Hermann, décédé en 2014, afin d’obtenir une licence
pour sa voix. Ils ont accepté.


Coexister avec les IA


Taylan Kamis n’est pas le seul à considérer que l’IA et les humains
pourraient s’entendre dans le domaine de la narration vocale. Charles
Watkinson souhaite utiliser l’IA pour tester quels livres mériteraient
d’être enregistrés par un humain. Si un ouvrage se vend particulièrement
bien, son succès pourrait justifier le coût de l’opération.


Cependant, tout le monde n’est pas optimiste. Certains acteurs du secteur
craignent qu’il y ait moins d’emplois pour les narrateurs qui ne sont pas
célèbres ou qui n’ont pas leur propre public. «

Tous ces narrateurs de niveau intermédiaire, vraiment solides, font un
excellent travail et c’est leur gagne-pain, mais ils ne seront pas
nécessairement attirés

», pense Andrea Fleck-Nisbet, directrice générale de l’Independent Book
Publishers Association.


Certains auteurs refusent d’utiliser une voix numérique. «

J’ai l’impression que le but de la fiction est d’évoquer les émotions
du lecteur ou de l’auditeur, et que la fiction traite de ce que cela
signifie d’être humain. Et une machine ne peut pas reproduire cela

», considère l’auteure Elizabeth Bell.


Chris Stokel-Walker a fait appel à Google pour la narration de son livre TikTok Boom (2021), consacré à l’application vidéo populaire, et a
publié un article sur le résultat dans Inverse. «

Le résultat est un livre audio qui, bien que dépourvu de l’émotion que
l’on peut espérer, sonne bien

», explique-t-il


Pour Andrea Fleck-Nisbet, la narration par l’IA n’est qu’une des nombreuses
questions auxquelles l’industrie de l’édition sera confrontée. Il existe
d’autres incertitudes concernant l’IA et les droits d’auteur ou la
propriété intellectuelle. Cela ne veut pas dire que les narrateurs se
retrouveront au chômage la semaine prochaine.


John Behrens, propriétaire de Nashville Audiobook Productions, a travaillé
avec deux livres générés par l’IA au cours des dernières années,
essentiellement pour en contrôler la qualité. L’IA a rencontré des
problèmes. Elle ne pouvait pas prononcer les versets de la Bible et se
débattait avec les questions rhétoriques du texte. Un mauvais livre audio
peut produire 50 à 100 problèmes à résoudre, explique John Behrens. L’IA en
a produit des centaines. Ce qui l’amène à penser que les narrateurs humains
ne sont pas près de disparaître, du moins pour un certain temps. Il
conseille de ne pas paniquer. «

Si vous vivez dans la peur, pourquoi continuer à investir dans cette
carrière si vous pensez qu’elle va se tarir ?

»




Article de CNET.com adapté par CNETFrance


Image : Kirillm


Source link

Articles similaires

Bouton retour en haut de la page