Les smartphones deviennent de plus en plus nos assistants à intelligence artificielle, mais la qualité de leurs appels vocaux n’a quasiment pas évolué depuis des années. Nokia veut changer cela et annonce avoir réalisé le « premier appel vocal et audio immersif au monde » en utilisant un nouveau codec.
L’appel a été passé à l’aide d’un nouveau codec IVAS (Immersive Voice and Audio Services), qui fait partie de la future norme « 5G Advanced ». Selon le blog de Nokia, ce codec crée une « expérience sonore tridimensionnelle » qui rend les conversations plus « réalistes et engageantes ».
En théorie, il devrait s’agir d’une amélioration significative par rapport aux appels téléphoniques compressés et monophoniques d’aujourd’hui, qui n’ont pas beaucoup progressé au fil des ans, malgré l’introduction de fonctionnalités logicielles telles que l’isolation vocale.
Alors, quand pourrons-nous, nous autres utilisateurs, bénéficier de cette amélioration des appels vocaux ? Il y a une bonne et une mauvaise nouvelle. Selon Reuters, la technologie ne nécessite qu’un smartphone doté d’au moins deux microphones pour être compatible, ce qui est le cas de la plupart des meilleurs téléphones actuels.
Malheureusement, la norme 5G Advanced – censée succéder à la technologie cellulaire 5G actuelle – ne devrait pas être entièrement déployée avant quelques années, et le codec IVAS n’est encore utilisé par aucun réseau mobile.
Néanmoins, ce premier appel téléphonique dit « immersif » devrait lancer la machine pour les accords de licence nécessaires afin de rendre nos appels vocaux un peu moins brouillons et prêts pour les « applications de réalité étendue et de métaverse améliorées » que Nokia dit avoir en ligne de mire.
Appels téléphoniques spatiaux dans le métaverse
Nokia et ses partenaires du 3GPP (3rd Generation Partnership Project), qui ont co-développé le nouveau codec IVAS, ne l’envisagent clairement pas uniquement pour les smartphones et les appels audio.
Sur le site du 3GPP, certains des cas d’utilisation incluent les « téléconférences multi-flux, les services conversationnels XR, le streaming de contenu en direct et pré-produit généré par l’utilisateur », en plus des appels téléphoniques plus conversationnels. Il voit également des « applications correspondantes dans l’espace AR/MR ».
En d’autres termes, il s’agit de faire des appels vocaux (et des conférences téléphoniques) une expérience plus spatiale et réaliste pour l’avenir, où l’on aura véritablement l’impression d’être en présence d’autres personnes, plutôt que de leur parler à travers un format compressé d’un âge révolu.
Il faudra quelques années pour que le codec IVAS soit licencié et entièrement adopté par les opérateurs mobiles, mais d’ici là, nous devrions avoir un espace de réalité mixte plus développé grâce à l’arrivée de casques supplémentaires sur le modèle de l’Apple Vision Pro et du casque XR/VR de Samsung, ainsi que des applications correspondantes.
Mais une amélioration de la qualité des appels vocaux sur nos téléphones, qui peut encore varier considérablement d’une application à l’autre, serait certainement un bonus très appréciable.