L’outil Genie text-to-3D ajoute une autre dimension aux algorithmes de l’IA générative et accélère la création d’actifs pour les métavers et les sims d’entreprise.
LL-E et Midjourney ayant conquis le monde de la génération texte-image en 2D, il n’est pas surprenant de voir les outils d’IA générative s’intéresser aux objets tridimensionnels. Là encore, les utilisateurs ont le choix entre de nombreuses approches d’IA générative 3D, avec des développeurs tels que Google, OpenAI, NVIDIA et Tencent, tous actifs sur la scène.
Cependant, une application de conversion de texte en image 3D qui se développe particulièrement est Genie, qui est disponible sur Discord en tant qu’avant-première de recherche. L’application gratuite d’IA générative 3D est accessible en acceptant une invitation Discord de Karan Ganesan, ingénieur fondateur de Luma AI, la société à l’origine de Genie.
Luma AI fait partie d’un nombre croissant d’entreprises qui aident les utilisateurs à introduire des objets réels dans le métavers grâce à des logiciels de capture 3D. L’un de ses outils les plus populaires, baptisé Flythroughs, a été annoncé en août 2023 et emmène les spectateurs dans un voyage assisté par l’IA à travers un monde photographié numériquement, comme s’il avait été filmé à l’aide d’un drone.
La technique du « téléphone et non du drone » va certainement bouleverser le monde des visites virtuelles et permet à toute personne disposant d’un iPhone et de l’application Luma Flythroughs de créer des séquences étonnantes. Et les merveilles de l’IA générative 3D ne s’arrêtent pas là, puisque toute personne souhaitant créer rapidement des actifs numériques pour sa crèche métavers ou prototyper un environnement de simulation industrielle voudra également jeter un coup d’œil à Genie.
Comment créer des actifs 3D à l’aide de l’IA générative
Luma propose sur son canal Discord un guide d’aide à la création qui montre aux utilisateurs comment commencer à utiliser l’outil de conversion de texte en 3D. La première étape consiste sans doute à commencer à réfléchir aux éléments que vous souhaitez placer dans un monde numérique en 3D. Et, une fois cette liste établie, de rédiger une liste de courtes descriptions qui serviront d’invites textuelles pour l’outil Genie 3D gen IA.
Par exemple, si vous construisez un bureau de direction dans le métavers, vous voudrez peut-être –
un fauteuil de bureau confortable
Une machine à café
Une armoire à trophées remplie de récompenses
Pour donner des instructions à l’application Luma AI, il suffit, à partir du premier bien, de taper –
/genie une chaise de bureau confortable
Cinq robots génies sont disponibles. Sélectionnez l’un d’entre eux et entrez votre message, préfixé par
Donuts et théières – le « hello world » de la modélisation 3D
L’équivalent du « bonjour du monde » dans la modélisation 3D est la création d’un beignet réaliste. Les théières sont également un point de départ populaire. Il est remarquable de constater la rapidité avec laquelle le moteur d’IA générative 3D de Genie est capable de réaliser ces deux tâches.
Les utilisateurs peuvent télécharger les modèles (y compris les textures) de l’outil IA générative 3D Luma Genie sous forme de fichiers GLB, le GLB étant une version plus compacte des fichiers GL Transmission Format (glTF).
Envie d’un accoudoir plus grand sur votre fauteuil de bureau virtuel ? Les fichiers GLB téléchargeables à partir de l’outil Genie de Luma AI peuvent être importés dans Blender, où vous pouvez commencer à sculpter le modèle IA générative 3D comme un morceau d’argile numérique.
En passant seulement quelques heures avec Genie, et sans expérience préalable de la modélisation numérique en 3D, vous pouvez faire un long chemin rapidement grâce à la puissance de l’IA générative en 3D. La première vague d’outils de conversion de texte en image était époustouflante en deux dimensions, et la dernière génération d’applications de conversion de texte en 3D, comme Genie, est d’un niveau supérieur.
Ce qui est intéressant aussi, c’est que l’arrivée d’applications d’IA générative 3D capables et conviviales pour les débutants coïncide avec la sortie de casques VR de réalité mixte de nouvelle génération, comme le Quest 3. En parlant avec des développeurs d’applications VR et en visitant les laboratoires des développeurs de puces de réalité étendue (XR), on a l’impression que 2024 pourrait être une année de percée pour la RV d’entreprise.
Le fait que vous puissiez apprendre des tâches du monde réel dans la RV fait du métavers un espace professionnel intéressant pour les entreprises. Désormais, les créateurs de ces mondes – qui peuvent être des environnements productifs non seulement pour des réunions virtuelles, mais aussi pour acquérir une expérience pratique de la fabrication sans gaspillage ou de la conduite de machines lourdes, pour ne citer que quelques exemples – peuvent très rapidement ajouter des actifs numériques à l’aide d’une simple invite textuelle.