Apprentissage par renforcement guidé par l’humain pour l’entraînement de personnages virtuels autonomes – Une approche Human-in-the-Loop

L’industrie du jeu vidéo fait face à un défi majeur : créer des personnages virtuels intelligents qui s’adaptent aux utilisateurs tout en respectant la vision créative des concepteurs. L’apprentissage par renforcement (RL) permet aux agents virtuels d’apprendre par essai-erreur, mais fonctionne de manière entièrement autonome, sans possibilité d’intervention humaine pendant l’apprentissage. L’IA peut ainsi développer des stratégies techniquement optimales mais créativement inappropriées : comportements exploitant des failles, styles de combat irréalistes, ou personnalités incohérentes avec l’univers narratif.
Ce projet propose d’explorer et d’évaluer une approche d’apprentissage par renforcement guidé par l’humain (Human-in-the-Loop), afin d’investiguer comment les concepteurs peuvent influencer et orienter l’apprentissage des personnages virtuels en temps réel. Cette recherche vise à étudier les mécanismes de collaboration entre intelligence artificielle et expertise humaine dans le contexte de la création d’agents virtuels adaptatifs.
L’étude portera sur l’analyse de méthodes permettant aux concepteurs de définir des contraintes créatives, d’annoter les comportements appris par l’IA, et d’ajuster dynamiquement les priorités d’apprentissage. Cette approche permettra d’examiner comment garantir que les personnages développent des comportements sophistiqués tout en respectant les objectifs de conception. Les contributions scientifiques attendues incluront de nouvelles méthodologies d’intégration du feedback humain dans les algorithmes de RL, une meilleure compréhension des mécanismes de guidage créatif, et l’établissement de frameworks théoriques pour l’apprentissage collaboratif homme-IA.
Cette recherche contribuera à l’avancement des connaissances en apprentissage automatique guidé par l’humain, tout en établissant les bases scientifiques pour de nouveaux paradigmes d’interaction entre créativité humaine et systèmes intelligents adaptatifs.

Faculty Supervisor:

Fabio Petrillo

Student:

Partner:

Paralog

Discipline:

Computer science

Sector:

Professional, scientific and technical services

University:

École de technologie supérieure

Program: