Apple et Nvidia veulent dominer l’univers en 3D et le monde de la simulation scientifique avec un bloc de construction soutenu par les deux entreprises.
Les partisans du logiciel propriétaire adoptent la route des normes ouvertes pour favoriser le développement et l’adoption d’un format de fichier appelé USD (Universal Scene Descriptor), qualifié de HTML du metaverse et de l’Internet en 3D.
L’Alliance of OpenUSD, ou AoUSD, souhaite faire de l’USD un pivot pour créer et rendre des mondes en 3D, des graphiques alimentés par l’IA et des avatars animés. Ces univers pourraient être sur Internet, dans des mondes de réalité virtuelle, dans des films ou dans des simulations scientifiques riches en graphismes.
Les autres membres fondateurs d’AoUSD incluent Pixar, Adobe et Autodesk. Aucun des autres principaux fabricants de puces, éditeurs de logiciels ou fournisseurs de cloud ne figure dans la liste des partisans initiaux. Le World Wide Web Consortium et l’Organisation internationale de normalisation ne considèrent pas encore l’USD comme une norme, mais l’objectif d’AoUSD est de l’amener à ce statut.
L’objectif est de « prendre le projet open-source créé par Pixar et d’en faire une spécification qui lui permettra de devenir une norme internationale utilisable par n’importe qui dans le monde, comme les normes que nous utilisons aujourd’hui comme JPEG ou H.264, HTML ou d’autres normes », a déclaré Steve May, le président d’AoUSD et directeur de la technologie chez Pixar, lors d’un point de presse.
Le format de fichier permet aux entreprises de partager et de réutiliser des actifs en 3D dans des mondes virtuels ou des applications graphiques. Les animateurs peuvent simplement prendre des objets en 3D à partir de référentiels existants et les ajouter à leurs projets. Les objets 3D peuvent être des modèles, des animations, des arrière-plans, des matériaux et autres actifs.
Les implémentations USD utilisent généralement des moteurs de rendu qui extraient des descriptions procédurales pour assembler des scènes à partir d’actifs partagés. Nvidia a collaboré avec Pixar sur de nombreux projets dans son produit de metaverse appelé Omniverse, qui s’appuie sur les GPU de l’entreprise pour rendre des animations, des mondes virtuels et des simulations.
Le format de fichier USD est utilisé depuis des décennies par Pixar pour créer des films d’animation. La société a développé USD pour réutiliser les animations plutôt que de recréer chaque pixel à partir de zéro. Aujourd’hui, USD joue un rôle de premier plan dans les efforts de création de films de Pixar.
La création de scènes animées complexes implique de nombreux flux de travail, contenus en 3D, outils logiciels et technologies, explique M. May.
« Et historiquement, ces outils utilisaient tous des données et des formats de fichiers différents. Pixar souhaitait permettre une expression créative plus puissante pour l’artiste en rationalisant les flux de travail pour permettre la même réutilisation des données… par tous les outils de création de contenu », dit M. May.
L’USD est un unificateur pour les graphiques en supercalcul et en divertissement, ajoute M. May, en précisant : « Je vois cela comme une période passionnante alors que cela grandit et que nous pouvons voir des avantages qui se chevauchent entre les différentes zones. »
La stratégie de metaverse de Nvidia dépend du succès du format de fichier USD, qui dispose d’opérateurs de composition tels que la position, l’orientation, les couleurs et les couches, ce qui permet un partage et une collaboration en temps réel dans le metaverse.
Nvidia a présenté Omniverse comme un outil permettant aux ingénieurs de collaborer en temps réel à la création d’équipements tels que des avions, des voitures et des machines. La simulation Earth-2 de Nvidia des modèles climatiques, qui ingère des données visuelles de sources multiples, est basée sur le format de fichier USD et le moteur Omniverse.
Le fabricant de puces graphiques utilise l’intelligence artificielle et le metaverse pour vendre plus de GPU et de logiciels. Mais la plate-forme de développement de logiciels derrière Omniverse, appelée CUDA, est propriétaire. Nvidia restreint les clients CUDA à ses matériels et logiciels en IA et en metaverse, et l’USD lui permettra de créer des services.
Apple est comme Nvidia : les clients sont verrouillés dans les appareils, les logiciels et les services. Mais l’intérêt de l’entreprise pour la norme pourrait découler de sa récente introduction du casque Vision Pro à 3 999 dollars, qui est un ordinateur de casque sur lequel les utilisateurs peuvent regarder des films, faire des visioconférences et interagir avec des mondes virtuels.
Apple a qualifié le Vision Pro de « premier ordinateur spatial » responsable de la création d’une nouvelle catégorie de calcul spatial. Apple cherche à attirer les développeurs pour écrire des applications pour Vision Pro, et le format de fichier USD pourrait être au centre de tout cela.
L’USD « permet des expériences de réalité augmentée réalistes essentielles à des choses comme le calcul spatial », explique M. May.
Mais l’USD présente de nombreux problèmes d’utilisabilité. Il n’y a pas encore de mises en œuvre pratiques côté navigateur, et il dépend fortement du traitement côté serveur. Les utilisateurs de la technologie peuvent lire l’USD en créant leurs propres services Python et C++, après quoi ils peuvent renvoyer les informations nécessaires côté client.
Autodesk a fait quelques avancées en créant des bibliothèques qui rendront l’USD pratique dans les applications basées sur navigateur, a déclaré un porte-parole de Nvidia par e-mail.
Autodesk a créé un prototype pour les liaisons USD en JavaScript pour permettre un traitement côté client plus poussé et a posté des propositions pertinentes sur la page GitHub d’OpenUSD. OpenUSD est un référentiel open-source où le code USD réside, et AoUSD spécifiera et codifiera ce qui est représenté dans cette base de code.
D’autres accélérations USD dans le traitement côté client viendront grâce à la prise en charge native de WebGPU dans Hydra, qui est un moteur de communication et de rendu pour USD. WebGPU succède à WebGL et est conçu pour l’accélération côté client afin de distribuer le calcul de l’IA en tirant parti des GPU locaux, ce qui réduira la charge du serveur. Google a récemment annoncé que WebGPU était pleinement intégré dans Chrome.
Mais pour Apple et Nvidia, standardiser l’USD pour qu’il devienne le HTML de l’Internet en 3D sera un défi. Pour commencer, il doit rivaliser avec une norme qualifiée de JPEG en 3D.
Les entreprises penchent pour une alternative à l’USD, depuis longtemps établie, appelée glTF, qui est un format de fichier 3D soutenu par le W3C et l’ISO. Les formats de fichier glTF et USD sont discutés par le Metaverse Standards Forum, créé plus tôt cette année, mais qui n’inclut pas Apple et Pixar parmi ses membres.
« glTF est considéré comme une manière plus simple et plus légère de représenter les données en 3D. Et USD est considéré comme la manière de créer des scènes beaucoup plus complexes et d’impliquer davantage de personnes pour interagir avec elles en même temps », explique M. May.
Le format glTF, soutenu par Khronos, dispose d’un flux de travail bien établi avec une diffusion légère et une accélération basée sur le navigateur.
« Un des défis intéressants, et si nous relevons ce défi, c’est de savoir si nous pouvons rendre USD aussi léger et optimal pour des choses plus simples que glTF ? À bien des égards, ce serait idéal si nous avions une seule solution pour les deux. Cela sera un domaine actif de débat au sein de la communauté », indique M. May.
M. May affirme que l’USD sera le format de fichier pour la computation scientifique, qui nécessite des simulations graphiques complexes. C’est quelque chose que glTF ne peut pas gérer dans sa forme actuelle en tant que format d’interchange de données convivial pour le web.
« OpenUSD deviendra le bloc de construction fondamental sur lequel tout le contenu en 3D sera créé », ajoute M. May, en précisant que les applications industrielles ou les applications de visualisation scientifique ont des points communs avec ce qui est fait dans le domaine du divertissement.
Le pouvoir de l’USD réside dans la capacité d’agréger et de modifier un grand nombre d’actifs, puis de les combiner pour former une image complète, ajoute M. May.
La Joint Development Foundation de la Linux Foundation gérera les efforts d’AoUSD. AoUSD pourrait éventuellement collaborer avec d’autres associations telles que l’Academy Software Foundation (ASWF).
« La JDF est vraiment structurée pour aider à incuber ces techniques et technologies naissantes sur le chemin de devenir une norme », explique M. May.
La porte-parole de Nvidia a déclaré que l’ASWF dispose d’un groupe de travail qui, à l’avenir, collaborera avec AoUSD pour intégrer l’USD sur le Web.
Les parties prenantes des deux groupes partageront leurs résultats et leurs cas d’utilisation pour informer les priorités de la communauté.