Mobilité

VALL-E : cette IA de Microsoft peut copier et reproduire

VALL-E : cette IA de Microsoft peut copier et reproduire n’importe quelle voix


VALL-E
sonne comme

DALL-E
, l’intelligence artificielle d’OpenAI qui peut créer des images réalistes
à partir de descriptions textuelles. VALL-E est, elle aussi, une intelligence artificielle. Mais au lieu de générer des
images, elle imite et reproduit la voix d’un Humain.


L’outil a été développé par des chercheurs de Microsoft qui l’ont entraîné
avec 60 000 heures de discours en anglais réalisés par 7 000 locuteurs. Grâce à un enregistrement audio de 3 secondes, il est capable de
synthétiser une parole personnalisée de haute qualité, en préservant
l’émotion
du locuteur et en simulant l’environnement sonore.


Différentes utilisations possibles


Microsoft énumère quelques utilisations possibles de VALL-E, dont les
applications de synthèse vocale, l’édition vocale et la création de
contenus. Sinon, l’entreprise est également consciente du risque de détournement de sa technologie à des fins
malhonnêtes, notamment en l’associant à un outil de deepfake vidéo pour semer le trouble ou en s’en servant
pour usurper l’identité des gens au téléphone.


Ainsi, Microsoft a décidé de ne pas encore rendre l’outil disponible pour
le public, ni de fournir le code. La firme souhaite d’abord mettre en place
« un

protocole permettant de s’assurer que le locuteur accepte d’exécuter la
modification et le système permettant de détecter la parole éditée

 ».


Microsoft a publié quelques exemples audio générés par
VALL-E sur GitHub. Si certains
sont convaincants, d’autres le sont moins avec leur ton robotique.
Toutefois, il est possible d’améliorer le résultat en multipliant les
échantillons fournis à l’IA.

Image en une : BoliviaInteligente/Unsplash 


Source :


Frandroid


Source link

Articles similaires

Bouton retour en haut de la page