Mobilité

MusicLM, la nouvelle IA de Google génère de la musique avec

MusicLM, la nouvelle IA de Google génère de la musique avec une simple description


Google travaille depuis un moment sur

Sparrow
, son chatbot intelligent qui viendra concurrencer le
phénomène

ChatGPT

dans la génération de texte. Mais il ne s’agira pas de son seul outil d’IA.
La firme de Mountain View a également MedPaLM, un chatbot
dédié à la médecine qui répond à toutes vos questions médicales, mais qui
est encore loin d’être viable à ce jour. Et là, l’entreprise vient de
dévoiler MusicLM, une IA capable de créer de la musique sur la base d’une simple description textuelle.


Un fonctionnement simple


La marche à suivre est similaire à celle des technologies d’intelligence
artificielle générative
actuelles. En gros, l’utilisateur doit entrer un prompt (ou commande), lequel prend ici la forme d’une instruction textuelle. En réponse, l’outil va produire

« une musique de haute qualité à 24 kHz qui reste cohérente sur
plusieurs minutes »
, expliquent les ingénieurs de Google qui l’ont développé.


MusicLM promet un son de qualité avec une fidélité de haut
niveau aux demandes de l’utilisateur. Toutefois, suivant le type de musique
que l’on souhaite créer, il peut être nécessaire de se montrer le plus
précis possible dans sa description, en indiquant, par exemple, l’ambiance,
le genre et même des instruments spécifiques que l’on veut entendre dans l’audio. On peut
également ajouter des voix humaines et préciser le niveau de complexité de la musique à produire.


Sur son

site de démonstration
, Google présente quelques exemples de sons produits avec les instructions
fournies. Ceux-ci sont classés par type et peuvent n’exiger qu’un ou deux mots ou des phrases toute entière pour générer
une musique. MusicLM a, par exemple, produit un audio de 5 minutes avec un simple prompt comme« techno mélodique », « jazz relaxant » ou « swing ».


Un morceau de 30 secondes a, par ailleurs, été créé avec
cette description un peu plus complexe : «

La bande sonore principale d’un jeu d’arcade. Elle est rythmée et
entraînante avec un riff de guitare électrique accrocheur. La musique
est répétitive et facile à mémoriser, mais avec des sons inattendus,
comme des coups de cymbale ou des roulements de tambour. »


Tout dépend de la demande l’utilisateur. Ce dernier a le choix entre plusieurs fonctionnalités pour créer sa musique :
génération audio à partir d’une description riche (et complexe), génération
longue, mode histoire, conditionnement du texte et de la mélodie,
conditionnement par une image, etc.


Aucune date de sortie prévue pour l’instant


MusicLM est encore au stade de développement. Bien qu’elle impressionne
déjà beaucoup, la technologie n’est pas encore tout à fait mûre. En effet,
l’IA aurait encore quelques défauts, comme des difficultés
à saisir les descriptions avec négations ou des instructions temporelles.
Mais il ne s’agit pas de la seule raison pour laquelle l’outil ne sera pas
encore proposé au public. Apparemment, Google craint aussi les risques de « détournement potentiel de contenu créatif ». Le géant de la tech
préfère ainsi avancer à petit pas.


Image en une : Possessed Photography/Unsplash  – Source :

The Verge


Source link

Articles similaires

Bouton retour en haut de la page