La technologie de modélisation spatiale du monde sera présentée au CES 2026, qui se tiendra à Las Vegas du 6 au 9 janvier 2026. Fujitsu prévoit également d'effectuer des démonstrations techniques à son siège social tout au long de l'exercice 2026.

Caractéristiques de la technologie de modélisation spatiale du monde

1. Construction d'un modèle spatial de l'environnement à l'aide de graphes de scène 3D, axé sur les interactions entre les personnes, les robots et les objets.

Dans les environnements physiques, la situation spatiale évolue dynamiquement au gré des mouvements et des interactions des acteurs présents (personnes, robots, etc.). Bien que des technologies exploitant les données capturées par caméra pour appréhender ces dynamiques spatiales aient été explorées, les différences significatives de champ de vision entre les caméras fixes et mobiles, ainsi que les variations d'apparence (distorsions, par exemple), ont freiné leur application en temps réel.

C’est pourquoi, au lieu de s’appuyer sur une intégration au niveau du pixel, très sensible aux différences d’apparence, Fujitsu a développé une technologie qui utilise des caméras pour évaluer l’espace grâce à des graphes de scène 3D ; autrement dit, des structures de données hiérarchiques qui organisent tous les objets de l’espace physique sous forme de nœuds au sein d’un graphe. Cette approche minimise l’impact du champ de vision et de la distorsion, permettant une compréhension en temps réel d’environnements réels complexes et en constante évolution.

2. Prédiction des états et comportements futurs par la modélisation des interactions entre les personnes, les robots et les objets

Pour que les humains et les robots collaborent harmonieusement, ces derniers doivent être capables de comprendre les intentions qui sous-tendent les actions humaines et d'anticiper les comportements futurs. Les technologies de modélisation du monde, qui permettent aux robots d'anticiper les changements et d'agir dans leur environnement immédiat, font l'objet de recherches approfondies. Cependant, jusqu'à présent, elles se sont limitées à la modélisation de l'environnement proche, sans parvenir à saisir les changements dynamiques qui se produisent dans l'ensemble de l'espace.

La nouvelle méthode développée par Fujitsu estime avec précision les intentions comportementales en interprétant les relations causales issues des interactions entre acteurs et objets au sein d'un espace. Grâce à ces données, elle permet de prédire les actions futures, d'éviter les collisions et de générer des plans d'action coopératifs optimaux pour plusieurs robots autonomes.

Des tests réalisés avec des ensembles de données académiques référencés publiquement ont confirmé que cette technologie peut améliorer jusqu'à trois fois la précision de l'estimation des intentions comportementales. [1].

Contexte

L'intelligence artificielle, jusqu'ici principalement développée dans des environnements numériques, commence à s'appliquer à des situations concrètes. L'IA physique, branche de l'intelligence artificielle, entraîne l'IA à comprendre les lois de la physique et à agir de manière autonome. Elle jouera un rôle clé dans la résolution de divers défis du monde réel, tels que la conduite autonome et les usines intelligentes. Cette approche suscite un vif intérêt, car elle représente une solution potentielle pour pallier la pénurie de main-d'œuvre croissante au Japon et améliorer la productivité industrielle.

Cependant, les applications actuelles de l'IA physique se limitent en grande partie aux environnements structurés avec des itinéraires définis, tels que les usines ou les entrepôts logistiques. Dans les habitations et les bureaux, où les mouvements humains sont moins prévisibles et où la disposition des objets change fréquemment, l'IA peine à évaluer la dynamique spatiale, ce qui rend les solutions actuelles impraticables. De plus, dans les environnements nécessitant la collaboration d'un grand nombre de personnes et de robots, la coopération demeure complexe, car l'IA est incapable de comprendre les intentions qui sous-tendent les mouvements de chacun.

Cette nouvelle technologie repose sur la technologie de vision par ordinateur de Fujitsu, principalement utilisée pour analyser le flux de piétons dans les zones commerciales et détecter les comportements anormaux à des fins de prévention de la criminalité, ainsi que sur sa technologie d'intelligence artificielle, notamment l'agent IA Fujitsu Kozuchi, capable d'effectuer des tâches de manière autonome aux côtés des humains. Elle s'inscrit dans le cadre des travaux de recherche du Centre de recherche en robotique spatiale, créé par Fujitsu en avril 2025 afin de renforcer ses recherches visant à bâtir une société où humains et robots coexistent.

Note

[1] JRDB-Social : Référence pour l'estimation du comportement et des intentions humaines à partir d'images capturées par des caméras.