Pourquoi l'explosion de l'intelligence artifitielle a d'énormes répercussions sur les métavers ?

Pensez à la maison de vos rêves. Peut-être a-t-elle des plafonds hauts et arqués, une cheminée rugissante et de grandes fenêtres qui donnent sur un lac tranquille. Ou peut-être s’agit-il d’un dôme métallique respirant qui se trouve sur une planète ardente et qui est rempli de majordomes extraterrestres. Et si vous pouviez écrire un paragraphe sur ces maisons, puis entrer immédiatement dans leur version virtuelle et y amener tous vos amis ?

Grâce à des développements récents de l’IA comme ChatGPT et DALL-E, un avenir dans lequel les utilisateurs pourront créer leurs propres mondes étranges et immersifs n’est pas loin. À l’automne, trois nouveaux générateurs de texte en 3D ont été annoncés : GET3D de Nvidia, Make-a-Video de Meta et DreamFusion de Google.

Les créateurs de métavers utilisent déjà des générateurs de texte tels que ChatGPT – qui répond à des invites textuelles avec un équilibre et une intelligence étonnants – et des générateurs visuels tels que DALL-E – qui crée des images à partir d’invites textuelles – pour imaginer de nouveaux mondes et de nouvelles conceptions. Les initiés de l’industrie des métavers affirment que ces technologies d’IA seront essentielles à la création de mondes virtuels riches en détails et personnalisables, et qu’elles sont la clé de la création de métavers dans lesquels les gens ordinaires voudront vraiment passer du temps.

« Nous sommes en mesure de remplir l’internet de choses intéressantes parce que tout le monde est capable de prendre une photo, d’enregistrer une vidéo ou d’écrire des mots », explique Rev Lebaredian, vice-président de l’Omnivers et de la technologie de simulation chez le fabricant de puces Nvidia. « Si nous voulons créer un internet en 3D, il faut absolument que les personnes qui y participent créent également du contenu, et le seul espoir que nous ayons d’y parvenir est que l’IA puisse nous aider. »

Changer les flux de travail
Si l’utilisation d’outils d’IA dans la création de métavers n’est pas encore tout à fait au point, elle joue déjà un rôle crucial, bien que légèrement mondain. ChatGPT, par exemple, est utilisé par les créateurs de métavers pour réfléchir à des idées, écrire du code et composer les textes des decks et des emails.

Lorsque j’ai effectué mes recherches pour cet article, j’ai envoyé un courriel à Sean Ellul, cofondateur du studio de développement 3D Metaverse Architects, pour lui demander s’il avait été touché par ChatGPT. Il m’a répondu par un courriel de cinq paragraphes bien rédigés sur la façon dont il utilise la technologie. Mais il y a un hic : au quatrième paragraphe, l’e-mail révèle qu’il a en fait été écrit par ChatGPT lui-même. Ellul avait saisi l’invite suivante dans le service, puis l’avait envoyée (avec un minimum de modifications) :

« Ecrivez un e-mail à Andrew, du TIME, sur la façon dont, dans la société Metaverse Architects, nous utilisons ChatGPT pour réfléchir à des codes, préparer des articles et imaginer de nouveaux projets. Nous l’utilisons même pour écrire des e-mails, comme celui-ci ! »

L’e-mail qui s’ensuivit était statique, mais tout à fait crédible et informatif. C’était la preuve des pouvoirs de base de ChatGPT et de la façon dont Ellul l’a intégré dans ses processus quotidiens. Ellul dit utiliser ChatGPT pour peaufiner des idées de conception, solliciter des techniques de marketing, créer des plans d’architecture et bien d’autres tâches encore.

« Je ne saurais trop insister sur l’utilité de ce système pour nous », déclare Ellul.

Lorsque je demande à Ellul : « Combien de fois par jour utilisez-vous ChatGPT ? » Il répond : « Combien de fois par jour faites-vous une recherche sur Google ? ». L’IA s’est complètement intégrée à son flux de travail et à la façon dont il reçoit les informations, dit-il.

Pretty much every smart person I know has a ChatGPT tab open while they work now. Amazing how fast that happened.

— Nabeel Qureshi (@nabeelqu) 21 janvier 2023

An image created via the AI program Midjourney from Sean Ellul's prompt: "create a floor plan sketch with measurements and dimensions of a house plan built on one floor including two bedrooms three bathrooms kitchen and living and a garden. Include furnishing."<span class="copyright">Sean Ellul</span>

Faire naître des personnages et des mondes
Les services d’IA ont un impact considérable sur la création de métavers en particulier. Les mondes virtuels doivent être remplis de détails riches dans leurs paysages, leurs objets et leur architecture. L’IA peut utiliser des invites pour construire ces environnements beaucoup plus rapidement qu’un humain ne peut le faire à la main. Ellul compare le processus à une version améliorée de la création d’une planche d’humeur Pinterest : vous recherchez une esthétique ou un design, vous vous concentrez sur une itération de ce que vous aimez en particulier, et vous construisez lentement une vision globale.

Ainsi, sans avoir besoin d’une formation en design ou en architecture, les utilisateurs de l’IA seront finalement en mesure de créer des environnements virtuels en 3D : d’abord des pièces, puis des bâtiments, puis des mondes entiers. « L’IA jouera un rôle majeur dans la mise en place de ces expériences génératives qui pourront être créées à la volée en fonction des besoins, des intérêts et des désirs de l’utilisateur », explique M. Ellul.

Les métavers seront également remplis de personnes virtuelles, tout comme les jeux vidéo sont remplis de personnages non joueurs (PNJ). Mais alors que les PNJ ont des scripts préétablis, les personnages IA seront capables de vous répondre de manière organique, comme le fait ChatGPT pour vos questions.

Ce type de personnages IA existe déjà sous forme de texte : le site web character.ai, par exemple, vous permet de discuter avec des versions IA d’Elon Musk, de Socrate et de Billie Eilish. Il est facile d’imaginer ce type d’IA placé dans un monde virtuel, où il peut servir de guide touristique (comme une évolution de Clippy de Microsoft), de compagnon de quête ou de némésis.

Ellul affirme que sa société génère désormais de nouveaux personnages pour les jeux beaucoup plus rapidement qu’auparavant. Par exemple, il me montre l’image d’une femme dont les traits semblent presque photographiques. Il l’a créée en mélangeant neuf humains différents sur le générateur d’IA texte-image Midjourney, en ajustant l’algorithme petit à petit. Une fois qu’il a un visage dont il est satisfait, il va sur ChatGPT et tape : « générer une histoire pour une femme de 24 ans d’un petit village dans un cadre fantastique qui travaille dans une auberge. » En quelques secondes, l’IA a créé toute l’histoire d’Elspeth, une femme qui a « travaillé comme ouvrière agricole, apprentie forgeron et même serveuse dans une ville animée. Mais où qu’elle aille, elle a toujours eu l’impression que quelque chose lui manquait. » (En somme, assez générique, mais pas un mauvais point de départ pour un conte de fées).

La création d’Elspeth sous la forme d’une figurine en 3D entièrement étoffée, qui bouge de manière fluide et se conforme aux lois de la physique, nécessite toutefois des outils qui sont encore en cours de développement. Des sociétés comme Nvidia et Google ont annoncé des modèles de conversion du texte en 3D qui n’en sont encore qu’à leurs débuts, mais qui ne sont pas tout à fait prêts pour une large consommation publique. Les chercheurs de Nvidia, par exemple, ont annoncé Magic3D en novembre, une IA capable de créer des modèles 3D à partir d’instructions telles que « Une grenouille bleue venimeuse assise sur un nénuphar ». Mais cela prend toujours 40 minutes et est limité par la quantité de données sur la grenouille elle-même.

M. Lebaredian explique qu’à l’heure actuelle, Nvidia entraîne les IA dans son moteur de simulation 3D Omniverse, afin qu’elles apprennent rapidement à étiqueter et à construire des objets, à se déplacer dans des espaces et à répondre aux questions des utilisateurs. Lorsqu’on lui demande dans combien de temps un utilisateur lambda pourra construire la maison au bord du lac dont j’ai rêvé ci-dessus, il répond que les progrès de l’IA ne sont pas linéaires : il y a des accalmies et des explosions qui les rendent difficiles à prévoir. « Nous repoussons les limites en la matière, et cela se passe très vite », dit-il. « Je dirais que dans dix ans, je suis à peu près certain que la plupart des gens seront capables de créer du contenu 3D de haute qualité simplement en parlant à l’ordinateur. Et je suis optimiste quant au fait que cela se produira bien plus tôt. »

Signes de danger
Cette évolution rapide comporte de nombreux aspects effrayants, notamment l’idée d’habiter des espaces immersifs dans lesquels on ne sait pas si l’on parle à une personne réelle ou à une machine. Il est facile d’imaginer que les gens se fassent piéger beaucoup plus facilement, qu’ils prennent de mauvais conseils de la part des IA ou qu’ils développent une dépendance émotionnelle à leur égard. Ellul reconnaît qu’il existe des risques sérieux dans ce domaine, qui doivent être examinés avec soin. « Les Deepfakes vont probablement atteindre un tout autre niveau maintenant », dit-il. « C’est là que commencent les abus potentiels : Nous commençons à réaliser que vous pouvez simplement créer des identités à la volée. »

Lorsque mon collègue Billy Perrigo a interrogé directement ChatGPT sur les dangers de ses capacités de type humain, l’IA a répondu : « Il est important de se rappeler que nous ne sommes pas humains, et que nous ne devons pas être traités comme tels. Nous ne sommes que des outils qui peuvent fournir des informations et une assistance utiles, mais il ne faut pas se fier à nous pour les décisions critiques ou les tâches complexes. »

Les IA hébergent toutes sortes de préjugés basés sur les données sur lesquelles elles se sont entraînées, et ont produit une flopée de contenus toxiques, notamment des fausses informations et des discours de haine. Une récente enquête du TIME a révélé qu’OpenAI, la société qui a créé ChatGPT et DALL-E, faisait appel à des travailleurs kenyans externalisés, payés moins de 2 dollars de l’heure, pour examiner des contenus toxiques afin d’entraîner leurs algorithmes.

Pourtant, les entreprises d’IA vont de l’avant, soutenues par des milliards de dollars d’investissements. OpenAI, qui bénéficie d’un investissement de plusieurs milliards de dollars de la part de Microsoft, développe sa prochaine génération d’IA appelée GPT-4, qui pourrait être lancée dès ce trimestre et qui pourrait inclure la génération d’images et de textes, rapporte le New York Times. À mesure que les outils d’OpenAI seront de plus en plus utilisés, la manière dont l’entreprise elle-même traite les questions éthiques deviendra de plus en plus importante, de la même manière que les politiques d’expression de Facebook ont joué un rôle massif dans la politique mondiale au cours de la dernière décennie.

« Je ne suis pas en désaccord avec le fait qu’une technologie plus efficace conduirait les mauvais joueurs à être plus efficaces », déclare Ellul. « Plus notre monde est connecté, plus il est facile pour les mauvais et les bons acteurs d’avoir une influence. »

Il reste à voir si les technologies d’IA seront un outil d’autonomisation ultime – transformant les générateurs d’idées en créateurs virtuels et les écrivains en ingénieurs – ou un véhicule pour le vol d’identité et les abus. « Il est important de vraiment nous éduquer », dit Ellul, « afin de ne pas étouffer ces technologies lorsqu’il s’agit des avantages qu’elles peuvent nous apporter, ou de ne pas les autoriser trop loin lorsqu’il s’agit des risques potentiels. »

An illustration created by the AI Midjourney, from Sean Ellul's prompt of "4k hd portait of beautiful blonde woman with electric eyes and a deep stare"<span class="copyright">Sean Ellul</span>

Adapté du Times

Pourquoi l’explosion de l’intelligence artifitielle a d’énormes répercussions sur les métavers ?

Pierre Berendes

Pourquoi l’explosion de l’intelligence artifitielle a d’énormes répercussions sur les métavers ?

Pierre Berendes

Vers un métavers biomécanique : les greffes d’organes et l’impact sur la conscience

Comment comparer les solutions de jumeaux numériques ?

L’expérience du lieu à l’ère numérique : enrichir la notion de sentiment d’appartenance à un lieu