Google Genie 3 : le modèle du monde qui donne vie au Projet Genie

  • Genie 3 est le modèle du monde de Google DeepMind qui alimente le projet Genie, un prototype permettant de créer des environnements interactifs avec l'IA.
  • Project Genie génère des mondes navigables en temps réel à partir de textes et d'images, sans nécessiter de connaissances en programmation ou en design.
  • Les sessions sont limitées à 60 secondes et les scénarios ne sont pas entièrement photoréalistes, du moins dans cette phase expérimentale.
  • Pour le moment, ce service est uniquement disponible pour les abonnés Google AI Ultra aux États-Unis, mais une extension à d'autres territoires est prévue à l'avenir.

Google Genie 3

Google a commencé à démontrer concrètement les capacités de sa nouvelle génération de modèles mondiaux avec Genie 3Grâce au projet Genie, l'entreprise permet à certains utilisateurs de créer et d'explorer des environnements interactifs générés par l'IA à partir de descriptions en langage naturel et de quelques images de référence.

Cette initiative s'inscrit dans le cadre de l'engagement de Google DeepMind envers des systèmes capables de simuler des dynamiques complexes du monde réelAu-delà des agents classiques qui dominent les jeux fermés comme les échecs ou le go, ce projet ambitionne un avenir où concevoir des mondes virtuels sera aussi simple que de coucher ses pensées sur le papier. Bien que l'accès soit actuellement réservé aux abonnés payants aux États-Unis, le projet envisage un avenir où créer des mondes virtuels sera aussi facile que de noter ses idées.

Génie 3 : Le modèle du monde à l'origine de l'expérience

Au cœur du Projet Genie se trouve Genie 3, un modèle à usage général Développé par Google DeepMind. Contrairement à d'autres systèmes plus statiques, sa fonction n'est pas seulement de dessiner de beaux paysages, mais aussi de prédire comment un environnement change lorsque l'utilisateur se déplace, interagit avec lui ou modifie des éléments qui le composent.

Ce type d'architecture est connu sous le nom de modèle mondialGenie 3 est un système d'IA capable d'anticiper l'évolution d'un scénario et l'impact des actions dans cet environnement. Il génère le parcours que vous suivez en temps réel, image par image, en conservant une cohérence spatiale et visuelle qui va bien au-delà d'une simple animation ou d'une promenade dans une scène 3D figée.

Pour ce faire, le modèle utilise génération autorégressiveCette technique permet à l'IA de construire le monde étape par étape, en se souvenant de ce qu'elle a déjà créé. Si le personnage fait demi-tour ou revient sur ses pas, l'IA « se souvient » de ce qui se trouvait auparavant et le reconstruit de manière cohérente – un élément clé pour simuler de vastes espaces réalistes, qu'il s'agisse d'un environnement urbain, d'un paysage historique ou d'un monde entièrement fictif.

Comment fonctionne Project Genie : du texte au monde jouable

Le projet Genie est présenté comme une application accessible depuis le navigateurComme pour les autres services Google basés sur l'IA, il n'est pas nécessaire d'installer quoi que ce soit ni de posséder de connaissances techniques avancées : l'interaction se résume essentiellement à décrire ce que vous souhaitez réaliser et à laisser le système faire le reste.

Le processus commence par une phase que Google appelle « esquisser des mondes »L'utilisateur répond à des questions simples comme « À quoi ressemble votre monde ? » et fournit des détails sur le cadre (paysage, météo, style graphique, ambiance) et sur la façon dont il préfère l'explorer : à pied, en avion, en voiture, à cheval ou par d'autres moyens de transport. Il indique également son point de vue préféré, à la première ou à la troisième personne.

Google Genie 3

Ensuite, il faut définir le personnage : Il peut s'agir d'une personne, d'un animal, d'un objet ou de toute autre entité. Plus abstrait. C’est là qu’intervient Nano Banana Pro, un autre modèle Google qui génère une image d’aperçu statique. Ce type de capture d’écran initiale permet de vérifier si le monde correspond aux attentes de l’utilisateur avant de se lancer dans une exploration interactive.

Si le résultat n'est pas convaincant, il est possible modifier l'invite, changer des éléments de la scèneLes utilisateurs peuvent modifier l'apparence de leur avatar ou ajuster son style visuel. Ils peuvent importer leurs propres images, utiliser des éléments générés par d'autres IA ou partir de photographies réelles ; le système combine ensuite toutes ces données pour affiner l'environnement et créer une expérience immersive.

Exploration en temps réel : des mondes qui réagissent à vos mouvements

Une fois le monde défini et l'aperçu accepté, Project Genie passe en mode interactif. C'est à ce moment-là que… Genie 3 déploie ses capacités de simulationÀ mesure que le joueur se déplace dans la scène, le modèle génère en temps réel ce qui se trouve devant lui, en tenant compte de ce qui a déjà été créé et des règles physiques approximatives de l'environnement.

L'utilisateur se déplace à l'aide des commandes standard des jeux PC, telles que les touches W, A, S et D pour le déplacement, et peut régler la caméra Pour modifier l'angle de vue, l'expérience se déroule dans une résolution allant jusqu'à 720p et avec une vitesse d'interaction d'environ 20 à 24 images par seconde, ce qui est suffisant pour offrir une fluidité appréciable dans cette phase expérimentale.

Parmi les exemples suggérés par Google, on peut citer : un océan de vagues géantes vu du bout d'une planche de surfOu encore un environnement de haute montagne avec de la neige déformable où le joueur incarne un alpiniste aux mouvements omnidirectionnels. Dans les deux cas, l'intérêt réside non seulement dans le paysage initial, mais aussi dans la façon dont l'environnement réagit aux actions, aux changements de direction ou aux sauts du personnage.

Remixez, partagez et expérimentez avec d'autres mondes

Project Genie ne repart pas de zéro à chaque fois. L'une de ses caractéristiques les plus remarquables est sa capacité à « remixer les mondes existants »Les utilisateurs peuvent explorer des scénarios précédemment créés, soit par eux-mêmes, soit par d'autres, soit sélectionnés dans une galerie thématique, et les utiliser comme base pour générer de nouvelles versions.

Cette option de remix permet appliquer de nouvelles instructions à un monde déjà généréCela peut se faire en modifiant le style, en ajoutant des éléments, en changeant la façon dont le jeu est exploré ou en modifiant complètement le type de personnage. De plus, un mode de génération aléatoire, appelé « randomiseur », propose des environnements aux caractéristiques imprévisibles pour ceux qui recherchent l'inspiration ou qui souhaitent simplement expérimenter.

À la fin d'une session, le système offre la possibilité de Téléchargez les vidéos de la visite, une manière simple de partager des créations sur les réseaux sociaux, les plateformes vidéo ou dans des contextes professionnels, tels que les studios d'animation, les studios de conception de niveaux ou les laboratoires de recherche qui souhaitent documenter leurs expériences.

Limitations techniques et état d'avancement du projet

Malgré tout son potentiel, Google insiste sur le fait que le projet Genie est, pour l'instant, un prototype de recherche préliminaireCela se manifeste clairement par plusieurs restrictions que le laboratoire lui-même détaille dans son blog et ses notices d'utilisation.

Le plus clair est le limitation du temps des séancesChaque monde ne peut être exploré que pendant 60 secondes maximum, la limite de mémoire visuelle que Genie 3 peut actuellement gérer de manière stable. Cela limite la durée des expériences, qui ressemblent pour l'instant davantage à des micro-aventures ou à de courtes scènes qu'à de véritables jeux vidéo.

De plus, Google avertit que le Les scènes ne sont pas complètement photoréalistes. De plus, ils ne suivent pas toujours les instructions de l'utilisateur à la lettre. La physique peut également être approximative : certains comportements, collisions ou mouvements peuvent ne pas toujours respecter les lois du monde réel, ce qui est normal pour un système encore en développement.

Un autre point souligné est le contrôle des personnages, qui Ils peuvent présenter une certaine latence ou un manque de précision en réponse aux commandes de l'utilisateur. Bien que la fréquence d'images soit acceptable, de légers délais de réponse sont perceptibles, notamment pour ceux qui sont habitués aux jeux vidéo commerciaux très soignés.

Enfin, certains Fonctionnalités avancées de Genie 3 Les fonctionnalités annoncées dans les démos précédentes ne sont pas encore présentes dans cette version. Parmi elles, on trouve des événements déclenchables qui modifient le monde au fur et à mesure de l'exploration, une fonctionnalité qui pourrait enrichir considérablement le gameplay, mais qui reste pour l'instant prévue dans la feuille de route.

Plans d'accès restreint et d'expansion géographique

Dans cette première étape, l'accès au Projet Genie est Réservé aux utilisateurs de plus de 18 ans abonnés à Google AI Ultra Aux États-Unis. Cet abonnement, avec son tarif mensuel élevé, indique clairement que l'expérience vise initialement un public restreint, composé de professionnels ou de passionnés.

Google a indiqué son intention de étendre la disponibilité à d'autres territoires Une fois le système plus robuste et ayant recueilli suffisamment de données sur son utilisation réelle, on prévoit que, si le prototype progresse, il sera déployé à terme sur d'autres marchés clés, notamment l'Union européenne et, en son sein, l'Espagne. Bien qu'aucune date ni aucun pays précis n'aient été annoncés, on anticipe que, si le prototype progresse, il atteindra à terme d'autres marchés clés, notamment l'Union européenne et, en son sein, l'Espagne.

Cette expansion dépendra en tout cas non seulement de questions techniques, mais aussi de exigences réglementaires et de protection des données qui sont particulièrement strictes en Europe. Google insiste sur le fait qu'elle procédera par étapes et qu'elle n'hésitera pas à fermer les projets qui ne correspondent pas à ses objectifs, une mesure déjà appliquée à d'autres services de l'entreprise.

Un laboratoire pour l'IA générale et la création numérique

Au-delà de leur impact immédiat sur les jeux vidéo et le divertissement, Genie 3 et Project Genie s'inscrivent dans la stratégie de Google DeepMind visant à évoluer vers systèmes d'intelligence artificielle plus générauxLes modèles du monde sont particulièrement précieux pour la formation d'agents qui doivent comprendre des contextes complexes, prédire les conséquences et agir de manière cohérente dans des environnements changeants.

Les applications potentielles vont de robotique et simulation de scénarios physiques Cela englobe tout, de la modélisation d'animation et la reconstitution de lieux historiques à l'exploration d'univers fictifs pour le cinéma, la télévision et les contenus interactifs. La possibilité d'itérer rapidement sur des environnements générés par l'IA permet de réduire les délais et les coûts, un atout précieux pour les petits studios comme pour les grandes sociétés de production européennes.

Parallèlement, l'ouverture d'un tel prototype à des utilisateurs externes fonctionne comme un banc d'essai à grande échelleLes interactions, les erreurs et les idées apportées par les participants contribueront à ajuster le modèle, à identifier des cas d'utilisation qui n'auraient peut-être pas été envisagés auparavant et à évaluer les risques, tant techniques qu'éthiques, associés à ces simulations de plus en plus réalistes.

Avec Genie 3 et Project Genie, Google explore un territoire où la création de mondes virtuels devient beaucoup plus accessible, malgré des limitations évidentes en termes de qualité visuelle, de contrôle et de durée des expériences ; si l’expérimentation mûrit et surmonte la phase d’accès restreint, elle pourrait devenir un outil pertinent également pour les utilisateurs et les entreprises en Espagne et dans le reste de l’Europe intéressés par de nouvelles formes de conception interactive et de simulation par IA.

Google Genie 3
Article connexe:
Google Genie 3 : l'IA de DeepMind qui crée des mondes virtuels interactifs

Suivez-nous sur Google Actualités