Vous souvenez-vous de ce qu’était le travail avant COVID-19 ? Pour beaucoup d’entre nous, la pandémie mondiale a agi comme un catalyseur qui a non seulement transformé notre façon de travailler, de communiquer et de collaborer, mais aussi réduit momentanément notre empreinte carbone. Au plus fort de la pandémie, l’aviation, les transports de surface et la production d’électricité ayant diminué respectivement de 75 %, 50 % et 15 %, les émissions ont chuté à un niveau observé pour la dernière fois en 2006.
Alors que beaucoup d’entre nous reprennent le chemin du bureau, une étude récente a confirmé ce que beaucoup d’entre nous soupçonnaient : le travail à domicile peut avoir des conséquences positives pour la planète, mais pas de la manière dont nous pourrions l’imaginer. Publiée en septembre 2023 dans la revue Proceedings of the National Academy of Sciences, l’étude révèle que « le passage du travail sur site au travail à domicile peut réduire jusqu’à 58 % l’empreinte carbone du travail » aux États-Unis, mais uniquement lorsque des décisions favorables au climat sont prises concernant notre utilisation des technologies de l’information et de la communication, l’énergie que nous consommons au travail et à la maison, et les modes de transport que nous choisissons pour les trajets domicile-travail et pour les loisirs.
Les résultats de cette étude ouvrent la voie à un avenir potentiel auquel le Dr Hao Li travaille depuis de nombreuses années, un avenir dans lequel l’adoption généralisée par le public de la téléprésence 3D totalement immersive transforme la communication, le divertissement, le travail et l’éducation. « Nous essayons d’améliorer la façon dont les gens communiquent. Nous essayons d’améliorer la façon dont les gens communiquent. L’une des choses à laquelle nous travaillons est de remplacer le transport physique par la téléportation virtuelle. L’autre objectif est d’utiliser l’IA pour réaliser des choses qui ne peuvent pas être faites dans la vie réelle », explique le professeur associé de vision informatique à l’université Mohamed bin Zayed pour l’intelligence artificielle (MBZUAI), la première institution universitaire au monde dédiée à la recherche sur l’intelligence artificielle (IA).
PDG et cofondateur de Pinscreen, une startup qui construit des technologies d’avatars virtuels de pointe pilotées par l’IA, Li a passé plus de 17 ans à mener des recherches universitaires qui étudient l’intersection entre l’infographie, la vision par ordinateur et l’IA, avec un accent particulier sur l’utilisation des réseaux neuronaux, de l’apprentissage profond et des techniques pilotées par les données pour réaliser le traitement de la géométrie dynamique, la création d’avatars virtuels, la capture des performances faciales et la numérisation des formes 3D pilotée par l’IA.La carrière de Li a été définie par un lien étroit entre la recherche académique et le développement de produits.
Non seulement il cite Industrial Light & Magic, Lucasfilm Ltd, Disney Research Zurich, Meta VR/Facebook et Netflix sur sa liste de collaborateurs commerciaux, mais ses recherches ont également contribué à améliorer le traitement par radiothérapie des patients atteints de cancer dans le monde entier et à développer la technologie Animoji utilisée par l’iPhone X d’Apple. « Comment faire évoluer les technologies pour numériser les êtres humains ? Comment pouvons-nous capturer des environnements entiers, de sorte que les gens puissent être à un endroit mais en visiter un autre pour voir à quoi il ressemble ? », demande-t-il. « Li cite en exemple le récent lancement du traducteur universel de Google, qui permet de doubler des séquences de films avec une nouvelle traduction qui reprend le style et le ton de l’original, avec synchronisation des lèvres, comme une technologie pilotée par l’IA qui a le potentiel de transformer non seulement la façon dont nous regardons et apprécions les films, mais aussi la façon dont nous apprenons. « Il ne s’agit pas seulement de réaliser le traitement du langage naturel (NLP), qui nous permet de traduire une langue dans une autre.
Nous créons également des éléments visuels afin de pouvoir créer des cours en ligne où le professeur est capable de parler n’importe quelle langue en appuyant sur un bouton. Au lieu d’avoir des historiens ou des archéologues qui essaient de décrire l’aspect des choses dans le passé, nous pouvons maintenant utiliser des données pour reconstruire des environnements de sorte que vous puissiez retourner dans le passé, en faire l’expérience et interagir avec lui au lieu de simplement le voir », explique M. Li. « Le mot clé ici est la téléportation virtuelle. Il ne s’agit pas seulement de faire interagir des personnes, mais aussi de se trouver dans un autre endroit. « Lors d’une visite du Metavers Lab du MBZUAI, dont Li est le directeur et où il supervise une équipe internationale de neuf doctorants, l’universitaire fait la démonstration des dernières recherches du laboratoire, qui consistent à utiliser des réseaux neuronaux profonds pour visualiser des environnements en 3D en temps réel en n’utilisant rien d’autre qu’une vidéo capturée sur un téléphone portable.
La technique utilise un processus bien établi appelé structure à partir du mouvement, qui permet à l’IA de comprendre où se trouve la caméra par rapport à l’environnement qu’elle crée, ainsi que des réseaux neuronaux profonds capables de déduire à quoi un environnement est susceptible de ressembler lorsque les images sources sont incomplètes ou indisponibles, ce qui brouille la distinction entre le réel et l’imaginaire. « Nous construisons une technologie de téléprésence qui permet aux gens de communiquer, de manière immersive, à partir de n’importe quel point de vue dans un espace mobile en 3D, et cela a beaucoup d’applications potentielles parce que cela me permet d’aller où je veux », explique M. Li, en évoquant les développements dans les domaines de l’éducation, de la formation, des essais et du prototypage, qui seraient tous transformés par le déploiement d’une communication 3D totalement immersive : « Évidemment, la technologie est immédiatement bénéfique pour toutes sortes de jeux informatiques, mais je pourrais aussi visiter un musée, par exemple, ou un appartement en location et voir à quoi il ressemble. C’est une technologie qui a le potentiel de démocratiser la façon dont le contenu immersif et interactif est créé.