Informatique

Quand Alexa lit une histoire à un enfant… avec la voix de

Quand Alexa lit une histoire à un enfant... avec la voix de sa grand-mère décédée

Ces dernières années, Alexa – l’intelligence artificielle d’Amazon qui équipe les appareils connectés du géant du commerce en ligne – s’est largement imposée dans le quotidien de ses utilisateurs. Alexa reçoit plus d’un milliard de requêtes par semaine, fait même savoir Amazon, qui chiffre à plus de 100 000 les compétences (ou « skills ») d’Alexa. Le géant américain a profité de sa conférence re:MARS dédiée au machine learning, à l’automatisation, à la robotique et à l’espace, pour présenter une démonstration pour le moins dérangeante.

Celle-ci met en scène un garçon parlant à une enceinte Amazon Echo. « Alexa », demande le garçon, « est-ce que grand-mère peut finir de me lire Le Magicien d’Oz » ? Une voix de femme commence alors à parler. Vous l’aurez deviné, il s’agit bel et bien de la voix de la grand-mère décédée de l’enfant.

« Ce qui m’a le plus surpris à propos d’Alexa, c’est la relation de compagnonnage que nous avons avec elle », fait valoir Rohit Prasad, SVP et scientifique en chef d’Alexa AI. « Les attributs humains d’empathie et d’affect sont essentiels pour établir la confiance. Ils sont devenus encore plus importants en ces temps de pandémie, alors que tant d’entre nous ont perdu un être cher. Si l’IA ne peut pas éliminer la douleur de la perte, elle peut certainement faire durer les souvenirs. » Du côté d’Amazon, on ne livre pas de date exacte de disponibilité pour cette fonctionnalité.

Une IA bien encombrante

De nombreuses questions ont déjà été soulevées quant à l’éthique de la reproduction de la voix d’une personne réelle. Interrogé par ZDNet, Nate Michel, un responsable d’Amazon, explique toutefois que la technologie d’Amazon est encore « exploratoire à ce stade ». Générer une telle voix représente en effet un défi technique, comme l’explique Rohit Prasad, car il faut produire une voix de haute qualité avec moins d’une minute d’enregistrement, contre des heures d’enregistrement d’une voix en studio. Les équipes d’Alexa IA ont relevé le défi en le considérant comme une tâche de conversion de la voix plutôt que comme une tâche de génération de la parole.

Pour rendre Alexa encore plus humaine, Rohit Prasad explique qu’Amazon intègre l’intelligence généralisable dans l’outil. L’intelligence généralisable comprend trois attributs clés : l’apprentissage à travers de nombreuses tâches différentes, l’adaptation continue aux environnements des utilisateurs et l’apprentissage de nouveaux concepts par l’autosupervision.

Amazon travaille sur des approches comme penser avant de parler, dans lesquelles Alexa utilise effectivement des « connaissances implicites de sens commun » (construites à l’aide d’un grand modèle de langage et d’un graphique de connaissances de sens commun) pour générer des réponses à un utilisateur. Par exemple, si un client dit le jour de la Saint-Valentin « Alexa, je veux acheter des fleurs pour ma femme », Alexa pourrait exploiter sa connaissance du monde pour conseiller l’utilisateur en répondant « vous devriez peut-être lui offrir des roses rouges ». Ce qui serait aussi une expérience dérangeante, à n’en pas douter.

Source : ZDNet.com




Source link

Articles similaires

Bouton retour en haut de la page