Roblox crée son propre service de traduction de chats en temps réel pour les métavers

Le modèle peut traduire un total de 16 langues, dont l’anglais, le chinois, le français, l’allemand, l’italien, le coréen, le portugais, le russe et le turc.

oblox, une plateforme de jeux en ligne, a mis au point un système de traduction en temps réel basé sur l’IA qui permet aux joueurs de communiquer par texte entre eux, même s’ils parlent des langues différentes.

Dans un billet de blog rédigé par Daniel Sturman, directeur de la technologie, l’entreprise a révélé qu’elle avait dû développer un grand modèle linguistique (LLM) en interne pour parvenir à ce résultat. Le « modèle de traduction unifié » est capable de traduire les messages textuels avec une latence de base de 100 millisecondes, ce qui permet un processus de messagerie apparemment transparent et instantané.

« Imaginez que vous découvriez que votre nouvel ami Roblox, une personne avec laquelle vous avez discuté et plaisanté dans le cadre d’une nouvelle expérience, se trouve en fait en Corée – et qu’il a tapé en coréen pendant tout ce temps, tandis que vous tapiez en anglais, sans qu’aucun de vous ne s’en aperçoive », a déclaré M. Sturman. « Nous avons rendu possible sur Roblox quelque chose qui n’est même pas possible dans le monde physique : permettre à des personnes parlant des langues différentes de communiquer entre elles de manière transparente dans nos expériences immersives en 3D ».

Le modèle peut traduire un total de 16 langues, dont l’anglais, le chinois, le français, l’allemand, l’italien, le coréen, le portugais, le russe et le turc.

La traduction par IA n’est pas une nouveauté pour Roblox, qui utilise cette technologie pour traduire son contenu statique. La traduction en temps réel des chats est toutefois le moyen pour la plateforme d’éliminer les barrières linguistiques et de rassembler ses plus de 70 millions d’utilisateurs actifs quotidiens.

Le modèle contextuel reconnaît le langage spécifique à Roblox, y compris l’argot et les abréviations. Il est également capable de traduire n’importe quelle paire de langues. Par exemple, un joueur turcophone peut discuter en toute transparence avec un autre joueur qui ne parle que l’allemand ou le coréen. Selon M. Sturman, les deux plus grands défis ont été de créer un modèle capable de traduire indépendamment toutes les paires de langues et d’être suffisamment rapide pour prendre en charge les discussions en temps réel.

« Pour y parvenir, nous aurions pu créer un modèle unique pour chaque paire de langues (c’est-à-dire le japonais et l’espagnol), mais cela aurait nécessité 16×16, soit 256 modèles différents. Au lieu de cela, nous avons construit un LLM de traduction unifié, basé sur des transformateurs, pour traiter toutes les paires de langues dans un seul modèle », explique M. Sturman. « Étant donné une phrase source et une langue cible, nous pouvons activer l' »expert » approprié pour générer les traductions.

Pour les paires de langues « moins courantes », comme le français et le thaï, il n’y avait pas suffisamment de données de haute qualité à exploiter, ce qui a incité la plateforme à utiliser la « rétro-traduction », un système dans lequel le texte est traduit dans la langue d’origine et comparé au texte source pour en vérifier l’exactitude.

La rétrotraduction itérative a été utilisée au cours du processus de formation, les données « rétrotraduites » étant combinées aux données étiquetées existantes, ce qui a permis de créer un ensemble de données plus riche à partir duquel le modèle a pu apprendre. Ensuite, les traductions ont été soumises à un modèle d’estimation de la qualité qui se concentre sur l’amélioration de la clarté du texte traduit.

 

WP Twitter Auto Publish Powered By : XYZScripts.com