Une étude révèle que les photographies de chiens pourraient être utilisées pour générer des modèles 3D avec plus de précision.
Des chercheurs de l’université du Surrey ont appris à un système d’intelligence artificielle (IA) à prédire la pose en 3D à partir d’une image en 2D d’un chien.
Une myriade de chiens virtuels ont été créés à l’aide du jeu vidéo Grand Theft Auto.
Moira Shooter, étudiante en recherche de troisième cycle, a déclaré : « De l’écologie à l’animation, cette solution astucieuse offre de nombreuses possibilités d’utilisation.
L’un des moyens d’apprendre à l’IA à obtenir des informations 3D à partir d’images 2D consiste à lui montrer des photos tout en lui donnant des informations sur la « vérité de terrain » 3D, c’est-à-dire l’endroit où se trouvent les objets dans l’espace 3D.
Pour les humains, cela signifie porter des combinaisons de capture de mouvement.
Incapables de reproduire la même chose avec des chiens, les chercheurs ont modifié le code de Grand Theft Auto V, remplaçant le personnage principal par l’une des huit races de chiens – un processus connu sous le nom de « modding ».
Ils ont généré 118 vidéos de chiens assis, marchant, aboyant et courant dans différentes conditions météorologiques et d’éclairage.
L’équipe a appelé sa nouvelle base de données DigiDogs, composée de 27 900 images.
Ils prévoient maintenant d’affiner le système en utilisant le modèle DINOv2 de Meta pour s’assurer qu’il peut prédire une pose en 3D tout aussi bien à partir de vraies photos de chiens.
« Notre modèle a été entraîné sur des chiens en images de synthèse, mais nous avons pu l’utiliser pour créer des modèles squelettiques en 3D à partir de photographies d’animaux réels », a déclaré Mme Shooter.
« Cela pourrait permettre aux défenseurs de la nature de repérer les animaux sauvages blessés, ou aider les artistes à créer des animaux plus réalistes dans les métavers.
Elle a ajouté : « Les poses en 3D contiennent beaucoup plus d’informations que les photographies en 2D ».