«Facebook AI» apprend à l’intelligence artificielle à voir à la première personne !

Les équipes de recherche de «Facebook AI» se lancent actuellement dans un ambitieux projet de recherche baptisé «Ego4D». Il permettra de faire progresser la compréhension du monde par les systèmes d’IA (intelligence artificielle) avec une perspective égocentrique (à la première personne) puis de concevoir, à plus long terme, des assistants domestiques plus intelligents et plus immersifs. Le projet rassemble treize universités et laboratoires dans neuf pays, qui ont jusqu’à présent collecté plus de 2.200 heures de vidéos à la première personne, mettant en scène plus de 700 participants dans leur vie quotidienne.
La plupart des vidéos partagées en ligne (disponibles pour l’apprentissage des machines) ont été filmées à la troisième personne. L’IA, qui comprend le monde du point de vue de la première personne, pourrait cependant ouvrir une nouvelle ère d’expériences immersives à mesure que des dispositifs comme les lunettes en réalité augmentée et les casques en réalité virtuelle deviennent aussi utiles dans la vie quotidienne que les smartphones. En comprenant le monde tel que nous le voyons, les dispositifs de réalité augmentée pourraient montrer à l’utilisateur exactement comment tenir des baguettes pendant une leçon de batterie, le guider dans la réalisation d’une recette ou l’aider à retrouver ses clés, par exemple.
«Facebook AI» a également développé 5 critères de référence centrés sur l’expérience visuelle égocentrique. Ces critères peuvent servir de base au développement d’assistants IA plus intelligents, capables de comprendre et d’interagir dans le monde réel mais aussi dans le «métavers» où la réalité physique, la réalité augmentée et la réalité virtuelle sont réunies en un même espace.