L'illusion de départ

Quand on se lance dans la XR — réalité virtuelle, augmentée, mixte — on pense avoir affaire à un problème technique. Latence, tracking, performances GPU, stabilité du rendu. Ces problèmes sont solubles. Ils ont des métriques claires, des solutions documentées, des benchmarks.

Le problème d'UX, lui, n'a pas de benchmark. Et c'est là que ça devient vraiment difficile.

Chez Bigger Inside, nous avons passé cinq ans à développer Protocol 223 : un jeu de tir compétitif en réalité mixte, avec capture de mouvement corps complet via nos eXosuits, sur des arènes de 200 m², avec jusqu'à 10 joueurs simultanés. Techniquement, nous avons résolu des problèmes que beaucoup considéraient insolubles — fusion centimétrique du réel et du virtuel, tracking insensible aux occultations, latence en dessous de 12 ms.

Mais les problèmes les plus durs que nous ayons rencontrés n'étaient pas dans les capteurs IMU. Ils étaient dans la tête des joueurs.

Le problème de la présence

La « présence » est le Saint Graal de la XR : ce moment où le cerveau cesse de traiter l'environnement virtuel comme une représentation, et commence à le traiter comme réel. C'est un état fragile, fugace, et extraordinairement difficile à provoquer délibérément.

On peut la détruire en une fraction de seconde. Un glitch de tracking. Un avatar dont les mains traversent un mur. Un son désynchronisé de 80 ms. Une transition mal gérée entre l'espace réel et l'espace virtuel. Chacune de ces erreurs sort le joueur de l'immersion et lui rappelle qu'il porte un casque dans une salle.

Là où la XR est fondamentalement différente de tous les autres médias, c'est que la présence n'est pas une métrique — c'est une condition nécessaire à l'expérience elle-même. Un film mal réalisé reste regardable. Une expérience XR dont la présence est cassée ne livre plus rien.

Ce que nous avons appris : la présence se construit de manière systémique. Elle ne dépend pas d'un seul paramètre mais de la cohérence de l'ensemble du système. Sur Protocol 223, la fusion centimétrique des murs réels et virtuels n'était pas un choix esthétique — c'était la condition sine qua non de la présence. Le joueur devait pouvoir tendre la main vers un mur et le toucher. C'est cette correspondance physique qui ancrait l'expérience dans le réel.

L'onboarding : le paradoxe des nouveaux paradigmes

L'un des problèmes les plus sous-estimés en XR, c'est l'onboarding. Pas au sens marketing du terme — au sens littéral : comment est-ce qu'un être humain qui n'a jamais porté un casque de réalité mixte apprend à interagir avec un environnement en 3D, avec son corps comme seul contrôleur ?

Les designers UX expérimentés ont passé 20 ans à maîtriser les interfaces 2D : menus, boutons, icônes, affordances visuelles sur écran plat. En XR, rien de tout ça ne s'applique. Il n'y a pas de curseur. Il n'y a pas de "cliquer ici". Il y a un espace à 360 degrés, un corps qui se déplace, des mains qui peuvent saisir, pointer, frapper.

Chez Bigger Inside, nos joueurs n'étaient pas des gamers VR expérimentés. C'étaient des familles, des groupes d'entreprise, des ados en sortie scolaire. Beaucoup n'avaient jamais mis un casque de leur vie. Nous avions 8 à 10 minutes pour les équiper, les briefer et les projeter dans une expérience de jeu compétitif.

Nous avons revu l'onboarding une dizaine de fois. Chaque itération nous apprenait quelque chose de nouveau sur les modèles mentaux des joueurs novices. Les premiers essais supposaient que les gens comprendraient intuitivement comment utiliser leurs mains comme armes. C'était faux. La métaphore intuitive pour « tirer » diffère selon les cultures, les générations, les individus. Ce qui est évident pour un gamer ne l'est pas pour quelqu'un qui ne joue jamais.

La solution que nous avons trouvée n'était pas un tutoriel — c'était une zone de « calibration » dans le jeu lui-même, où les mécaniques étaient découvertes en jouant, pas en lisant. L'apprentissage par l'action, pas par l'instruction.

La locomotion : le problème fondamental

La locomotion est l'enjeu technique et UX le plus critique de la VR classique. Le cybersickness — cette nausée provoquée par le décalage entre les informations visuelles (mouvement dans le monde virtuel) et les informations vestibulaires (corps immobile dans le monde réel) — reste un frein massif à l'adoption grand public.

La solution que nous avons choisie dès le début était radicale : le free-roaming physique. Les joueurs marchent vraiment. Sur 200 m². Leurs pieds bougent, leur corps se déplace, leur oreille interne est parfaitement synchronisée avec ce que leurs yeux voient. Résultat : zéro cybersickness en free-roaming.

Mais le free-roaming génère ses propres problèmes d'UX. Comment indiquer les limites de l'espace de jeu sans briser la présence ? Comment gérer les collisions entre joueurs réels qui ne se voient qu'en avatar ? Comment concevoir un espace de 200 m² qui reste lisible pour un joueur qui ne l'a jamais vu ?

Nous avons dû inventer nos propres conventions. Les murs virtuels qui se matérialisent légèrement quand on s'en approche. Les avatars dont le rendu s'adapte à la proximité pour signaler le risque de collision physique. La superposition millimétrique des structures réelles et virtuelles pour que le joueur ait des repères physiques dans son environnement numérique.

Le corps comme contrôleur : des affordances sans écran

Quand le corps entier devient le contrôleur — comme avec les eXosuits de Protocol 223 — la question des affordances se pose de manière radicalement différente. Sur un écran, vous pouvez souligner ce qui est interactif avec une couleur, un contour, une animation. Dans un espace physique à 360 degrés, il n'y a pas de "surbrillance" naturelle.

Comment un joueur sait-il qu'il peut activer une compétence en levant le bras gauche ? Qu'il peut propulser une attaque en se baissant puis en se relevant d'un coup ? Ces affordances corporelles doivent être découvertes, mémorisées, et assez intuitives pour être exécutées dans le feu de l'action, sans réfléchir.

Nous avons travaillé avec nos game designers sur un principe simple : chaque compétence devait correspondre à un geste que le corps « voudrait » naturellement faire dans cette situation. L'esquive, c'est se baisser. Le bouclier, c'est lever les deux bras. L'attaque à distance, c'est pointer. Pas de mapping arbitraire, pas de combinaisons de boutons à mémoriser.

Ce travail de correspondance corps / action est infiniment plus difficile que du UX sur écran. Il demande une compréhension fine de la biomécanique, des instincts humains, et une capacité à tester physiquement — pas sur une maquette Figma, mais dans un espace réel avec de vrais joueurs qui suent et se déplacent.

Ce que j'ai appris

Cinq ans d'itérations sur Protocol 223 m'ont convaincu d'une chose : la XR est le médium le plus exigeant qui soit pour l'UX. Plus qu'un site web, plus qu'une application mobile, plus qu'un jeu vidéo classique.

Parce qu'en XR, vous ne concevez pas une interface. Vous concevez une réalité. Et une réalité mal conçue n'est pas simplement peu pratique — elle est physiquement désagréable, émotionnellement frustrante, et potentiellement nauséeuse.

Les principes que j'en retire :

La cohérence systémique avant l'esthétique. Une belle interface XR qui casse la présence vaut moins qu'une interface neutre qui la maintient. Chaque élément doit servir l'immersion ou disparaître.

Tester avec des non-initiés, toujours. Vos intuitions de designer viennent de 20 ans d'interfaces 2D. Elles sont fausses en XR. Seuls les vrais utilisateurs — ceux qui n'ont jamais porté de casque — vous diront ce qui marche réellement.

Le corps ne ment pas. Les métriques d'engagement classiques (temps passé, clics, conversions) n'ont pas de sens en XR. En revanche, la posture du joueur, l'amplitude de ses mouvements, et sa voix pendant l'expérience vous disent immédiatement si l'immersion est là ou non.

Itérer vite, en conditions réelles. Un prototype UX en XR qui n'est pas testé dans l'espace physique réel ne sert à rien. La maquette Figma, ici, c'est le jouer.


La XR tient ses promesses quand elle est bien conçue. Protocol 223, à son meilleur, produit quelque chose que je n'ai vu nulle part ailleurs : des joueurs qui sortent de l'expérience en cherchant leurs mots, parce que ce qu'ils viennent de vivre n'a pas d'équivalent dans leur référentiel habituel.

C'est la promesse de la XR. Y arriver, c'est le travail le plus difficile que je connaisse.

TRANSMIT

Un projet similaire ? Discutons-en directement.

[ Ouvrir le canal contact ] ▸