Gemini se prépare à créer des chansons à partir de textes

  • Google travaille sur un outil Gemini permettant de générer de la musique à partir de messages textuels intégrés à l'application.
  • Des références dans le fichier APK Android pointent vers la fonction MUSIC_GENERATION_AS_TOOL et une section musicale dans « Mes éléments ».
  • Cette technologie serait basée sur Lyria, le modèle musical de Google déjà disponible via API, et désormais destiné à l'utilisateur final.
  • Des doutes subsistent quant à la date de sortie, la disponibilité en Europe et le modèle d'accès (gratuit ou lié à des abonnements premium).

Gemini générera des chansons à partir de texte

Regarder une scène d'action en silence, c'est comme manger du pain sans sel : La musique donne de l'énergie et de la personnalité à ce que nous voyons.Mais composer une bande originale n'est pas donné à tout le monde. Google souhaite combler cette lacune, après avoir expérimenté depuis quelque temps des modèles musicaux au sein de son écosystème, et prépare désormais une étape plus ambitieuse avec Gemini.

Plusieurs analyses récentes du code de L'application Android de Gemini laisse entrevoir une nouvelle fonctionnalité capable de générer des chansons à partir de texte.Aucune annonce officielle n'a encore été faite, mais les détails techniques sont assez clairs : la société prépare un outil musical intégré à l'assistant, conçu pour permettre à chacun de créer des pistes audio sans avoir besoin de studios d'enregistrement, d'instruments ou de logiciels complexes.

Des expériences isolées à une fonctionnalité native de l'application Gemini

Jusqu'à présent, Google avait laissé entrevoir son intérêt pour la musique générée par l'IA dans le cadre de projets plus discrets, comme certaines fonctionnalités de Application Enregistreur sur les derniers téléphones Pixel ou des tests limités associés à des modèles vidéo comme Veo. Dans ces cas-là, l'IA intervenait pour accompagner les images ou les clips, mais aucun outil musical n'était clairement intégré au quotidien de l'utilisateur.

Cela commence à changer avec ce qui a été découvert à Analyse du fichier APK de la version 17.2.51.sa.arm64 de l'application Gemini pour AndroidLe code contient des références explicites à un utilitaire interne nommé comme « LA GÉNÉRATION_MUSICALE_EN_TANT_OUTIL »Ce nom fait référence à une nouvelle fonctionnalité permettant de créer de la musique au sein de l'assistant. Le fait que cette référence apparaisse déjà dans l'application, bien que non encore visible au public, indique que son développement est relativement avancé.

Outre cet outil, les éléments suivants ont également été détectés. Nouvelles références à une catégorie dédiée à la musique dans la section « Mes affaires » de GeminiCette zone, conçue pour regrouper ce que l'utilisateur génère avec l'IA (textes, images et autres contenus), inclurait désormais également les compositions sonores. Cela permettrait Sauvegardez, organisez et lisez les pistes générées sans quitter l'application elle-même, ce qui est particulièrement pratique pour réutiliser des extraits dans des vidéos, des podcasts ou des présentations.

La principale nouveauté réside dans le fait que la musique cesserait d'être une expérience isolée et deviendrait un des capacités natives supérieures à celles de l'assistant, équivalentes à la génération d'images ou à la rédaction de texteAu sein de l'écosystème Gemini, la créativité se déploierait sur trois fronts principaux : l'image, l'écrit et désormais aussi l'audio, le tout centralisé dans une interface unique.

Outil musical Gemini

Le rôle de Lyria et l'expérience antérieure de Google dans le domaine de la musique assistée par l'IA

Cette décision n'est pas sortie de nulle part. Google y travaille depuis un certain temps. modèles spécifiques pour la composition musicale utilisant l'intelligence artificielle. Parmi eux se distingue Lyrie, un système conçu pour créer des pièces instrumentales et contrôler leur évolution en temps réel, qui jusqu'à présent était proposé principalement via l'API Gemini et dans le cadre de projets pilotes avec des développeurs.

Grâce à Lyria, les applications tierces peuvent désormais permettre à leurs utilisateurs générer, diriger et jouer de la musique instrumentale de manière interactive, comme ce fut le cas avec le Groupe créé par IAToutefois, en pratique, ces fonctionnalités restaient quelque peu inaccessibles à l'utilisateur lambda : elles nécessitaient l'intégration de l'API, la conception d'une interface personnalisée et, dans de nombreux cas, une certaine expertise technique. La nouvelle fonctionnalité présentée dans Gemini modifierait cette approche en intégrant directement cette technologie à l'application mobile.

Au sein de l'écosystème Google, Lyria a également été utilisé en complément de modèles tels que Je vois, axé sur la génération vidéoCréer des bandes sonores sur mesure pour des clips générés par l'IA. Grâce à l'intégration musicale dans Gemini, il est désormais possible d'accompagner des images d'un son de synthèse. Ce serait à portée de main.sans avoir besoin d'utiliser des services distincts ni de manipuler des configurations complexes, ce qui rejoint les débats sur Problèmes d'IA sur YouTube.

La clé de ce changement réside dans le accessibilitéAu lieu de nécessiter des connaissances en programmation ou en production, l'idée est que n'importe qui peut Demandez des chansons, des mélodies ou des sons d'ambiance en utilisant des descriptions en langage naturel.Des créateurs de contenu à la recherche de musique de fond pour leurs vidéos aux étudiants qui souhaitent une piste pour se concentrer ou faire du sport, le champ d'application potentiel est vaste, tant en Espagne que dans le reste de l'Europe.

D'un point de vue stratégique, l'intégration de cette fonctionnalité à Gemini renforce l'engagement de Google envers un assistant qui agit comme centre créatif unifiéL'entreprise est en concurrence non seulement dans le domaine des réponses conversationnelles, mais aussi dans celui des outils qui contribuent à la production de contenu multimédia, un domaine où la musique générée par l'IA peut faire la différence par rapport à d'autres services.

Comment pourrait-on générer des chansons à partir de texte ?

Bien que l'interface finale n'ait pas encore été rendue publique, les références trouvées et les parallèles avec d'autres fonctions Gemini nous permettent d'imaginer un schéma d'utilisation assez clair. Très probablement, l'utilisateur devra Rédigez une phrase décrivant le type de musique que vous souhaitez.De la même manière que pour les images. Par exemple : « chanson rock motivante des années 80 pour faire du sport », « bande originale épique pour une bande-annonce » ou « musique électronique douce pour étudier le soir ».

Sur la base de cette description, l'assistant combinerait ses capacités à interpréter le langage naturel avec le modèle musical sous-jacentGénérer un morceau adapté au style, à l'ambiance et, éventuellement, à la durée spécifiée. L'expérience serait très similaire à celle des outils de création d'images classiques : l'utilisateur saisit quelques lignes, patiente quelques secondes et reçoit un résultat prêt à l'écoute.

Le code analysé suggère également qu'il pourrait y avoir commandes de base pour affiner le résultatIl pourrait s'agir de modifications d'intensité, d'instruments prédominants, de la présence ou de l'absence de voix de synthèse, ou encore de variations sur un même thème musical. Les détails restent à confirmer, mais cela correspondrait à la volonté de Google de proposer une interface simple avec des options minimales mais pratiques.

Un autre élément important est la catégorie musique dans « Mes fichiers ». À partir de là, les utilisateurs peuvent Enregistrez différentes versions d'une chanson, organisez vos projets sonores et réécoutez-les quand vous le souhaitez.Imaginez une petite bibliothèque musicale personnelle créée par l'IA. Cet espace faciliterait également la refonte de travaux antérieurs ou le partage d'extraits sur d'autres services de l'écosystème Google.

Quel que soit le design final, l'intention semble claire : apporter à l'audio la même immédiateté que celle déjà offerte par la génération d'images et de textes.Si le système s'avère suffisamment intuitif, de nombreux utilisateurs seront probablement amenés à intégrer la création musicale à leurs interactions régulières avec Gemini, que ce soit pour envoyer un message avec une mélodie personnalisée ou pour accompagner des projets plus élaborés.

Limitations, accès et éventuels filtres de droits d'auteur

Les chaînes de caractères trouvées dans l'application laissent également entrevoir des possibilités Restrictions d'accès selon le type de compteIl est possible que le nouvel outil musical soit initialement lié à des abonnements payants, tels que ceux de Gémeaux Avancé ou les forfaits Google One avec des fonctionnalités d'IA étendues, permettant aux utilisateurs gratuits d'avoir un accès limité ou de se connecter ultérieurement.

Parallèlement, tout indique qu'elles seront mises en œuvre. Des filtres pour empêcher la génération de chansons trop similaires à des œuvres commerciales existantes. ou l'imitation de la voix d'artistes spécifiques sans autorisation. industrie de la musique Elle suit de près l'émergence de l'IA depuis des mois, et en Europe, de surcroît, cadre réglementaire relatif au droit d'auteur et à l'utilisation des données Cela nous oblige à faire preuve de prudence avec ce type d'outils.

Il est raisonnable de penser que cette fonctionnalité imposera des restrictions lorsqu'un utilisateur tentera de demander quelque chose comme « une chanson comme celle de cet artiste » ou « une voix identique à celle de ce chanteur » sans autorisation ; en fait, il est probable que Google applique cette restriction. politiques contre la musique générée par l'IA Afin de prévenir les abus, la réglementation européenne exige elle-même la transparence des modèles d'IA et la protection des contenus protégés. Google devra trouver un équilibre entre flexibilité créative et respect de la propriété intellectuelle. si vous souhaitez déployer l'outil sans problèmes juridiques dans l'Union européenne.

Outre les limitations des droits, il reste à voir si d'autres seront introduites. limites sur la durée des morceaux ou sur le nombre de chansons pouvant être générées sur une période donnéeIl s'agit d'une pratique courante dans les services d'IA avancés. Ces restrictions peuvent servir à la fois à contrôler la consommation de ressources et à gérer la charge sur les serveurs pendant le déploiement de la fonctionnalité.

Pour les utilisateurs finaux, notamment les créateurs de contenu en Espagne et dans le reste de l'Europe, l'essentiel sera de comprendre Dans quelles conditions peuvent-ils réutiliser la musique générée par Gemini ?Si l'entreprise précise que les pistes peuvent être utilisées librement sur les réseaux sociaux, dans les podcasts ou pour des projets commerciaux, l'outil pourrait devenir une ressource très intéressante par rapport aux bibliothèques audio traditionnelles ou aux solutions tierces.

Musique générée par IA avec Gemini

État du développement, déploiement et impact potentiel en Europe et en Espagne

Pour le moment, tout ce que l'on sait provient de Analyse des applications et fuites techniquesGoogle n'a communiqué publiquement ni la date de sortie ni l'apparence finale de cette fonctionnalité musicale. Sa présence dans la version 17.2.51.sa.arm64 de l'application indique que le projet est en cours, mais également qu'il est encore en phase de tests internes.

Il reste à voir si l'entreprise optera pour une déploiement progressif par pays ou si elle tentera de lancer l'outil de manière plus ou moins simultanée sur les principaux marchés. Dans le cas particulier de l'Union européenne, les exigences du futur cadre réglementaire relatif à l'IA et les lois actuelles sur la propriété intellectuelle pourraient influencer à la fois le calendrier et les fonctionnalités disponibles dans chaque région.

Pour les utilisateurs espagnols, l'arrivée de cette fonctionnalité offrirait une alternative intégrée au sein de l'environnement Google, par rapport aux plateformes qui proposent déjà cette fonctionnalité. Pistes personnalisées générées par l'IALa possibilité de travailler directement depuis l'application Gemini, de synchroniser ses créations avec un compte Google et d'y accéder depuis différents appareils constituerait un avantage pratique par rapport à des services externes dispersés.

On ignore encore quel modèle économique Google choisira. L'entreprise pourrait proposer un Version gratuite limitée en qualité ou en nombre de pistesCela pourrait signifier réserver l'expérience la plus complète aux abonnés, ou bien positionner la génération musicale d'emblée parmi les fonctionnalités premium. Ce choix déterminera en grande partie si cette technologie sera accessible au grand public ou restera l'apanage de ceux qui paient déjà pour des outils d'IA avancés.

Si l'intégration est finalement confirmée et que les questions juridiques sont résolues, Il ne serait pas surprenant de voir prochainement des créateurs de contenu hispanophones intégrer de la musique générée par Gemini dans des vidéos courtes, des podcasts, du matériel pédagogique ou des présentations d'entreprise.De la même manière que les assistants IA sont utilisés aujourd'hui pour écrire des scripts, résumer des documents ou générer des images, la composition musicale pourrait devenir une autre étape de ce flux créatif numérique.

Tout porte à croire qu'il s'agit d'une tentative de Google pour rendre la composition accessible à tous ceux qui ont un téléphone portable dans leur poche : une fonction qui ne nécessite que quelques lignes de code pour que Gemini renvoie une chanson prête à être jouée.à condition que l'entreprise parvienne à peaufiner l'expérience, à clarifier le cadre juridique et à décider comment la mettre à la disposition des utilisateurs en Espagne, en Europe et dans le reste du monde.

Spotify va étiqueter les chansons créées avec l'intelligence artificielle
Article connexe:
Spotify va étiqueter les chansons créées avec l'intelligence artificielle

Suivez-nous sur Google Actualités