Google lance Lyria 3 dans l'application Gemini ce 18 février. Le modèle de DeepMind génère des morceaux de musique de 30 secondes à partir d'une description textuelle ou d'une simple photo. Paroles, cover art, tout est généré automatiquement. La fonctionnalité est accessible à 750 millions d'utilisateurs mensuels de Gemini — y compris en français.
Comment ça marche
Ouvrez Gemini, allez dans Tools > Music, et décrivez ce que vous voulez : un genre, une ambiance, un souvenir. « Une balade folk mélancolique pour un road trip sous la pluie » suffit. L'IA compose le morceau, écrit les paroles et génère une pochette via Nano Banana.
L'option image fonctionne aussi : uploadez une photo de vacances et Lyria 3 compose un morceau qui colle à l'ambiance. Vous pouvez ajuster le style, le tempo et les voix après génération.
Ce qui change par rapport à Lyria 2
Le modèle produit des morceaux plus réalistes et plus complexes, avec une cohérence structurelle — couplets, refrains et ponts distincts même sur 30 secondes. Les paroles sont désormais générées automatiquement (il fallait les écrire soi-même avant). La fenêtre de contexte longue maintient l'intégrité musicale sur toute la durée du clip.
La question du copyright
Là où Suno et Udio ont été immédiatement attaqués en justice par les labels, Google joue la carte de la prudence. Le modèle est entraîné sur le catalogue YouTube licensié et des accords partenaires. Les prompts mentionnant un artiste génèrent une inspiration stylistique, pas une imitation. Des filtres comparent les sorties aux œuvres existantes.
Chaque morceau est marqué par SynthID, le watermark invisible de Google qui permet de détecter si un contenu a été généré par IA. Une précaution devenue standard face aux questions de régulation.
Disponibilité et prix
Lyria 3 est en bêta, accessible aux 18 ans et plus dans 8 langues : anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais. Les abonnés AI Plus, Pro et Ultra bénéficient de limites de génération plus élevées. Les morceaux sont téléchargeables ou partageables par lien.
L'enjeu pour les créateurs
Google étend aussi Dream Track au-delà des États-Unis, permettant aux créateurs YouTube de générer des bandes-son IA pour leurs Shorts. Le modèle positionne les créateurs comme utilisateurs, pas comme ayants droit — une nuance qui soulève des questions sur la distribution des revenus.
La musique rejoint l'image, le texte et la vidéo dans l'arsenal génératif de Gemini. Reste à voir si 30 secondes suffisent — ou si ce n'est que le début.