Développement d’un outil d’analyse de texte assistée par ordinateur permettant de classifier les entreprises dans l’écosystème de la 5G au Canada

Prompt doit identifier les PME qui ont un fort potentiel de croissance au sein de l’écosystème canadien de la 5G. Dans ce contexte, la recherche propose d’exploiter une base de données textuelles. Elle est constituée par les sites internet de 7 000 entreprises. Cette base de données a déjà été construite par Prompt. Le premier but de l’analyse est l’exploration des spécificités thématiques des sites internet et leur classification par groupe d’entreprise. Plusieurs algorithmes et méthode statistiques venant du domaine de la fouille de texte (ou text mining) et du traitement automatique du langage naturel (ou Natural Language Processing – NLP) seront utilisés à cet effet. En particulier, les méthodes de fouille de thème (ou topic modeling) seront utilisées pour explorer les données textuelles.

Intern: 
Alvar Herrera
Superviseur universitaire: 
Catherine Beaudry
Isabelle Deschamps
Fabiano Armellini
Province: 
Quebec
Partenaire: 
Programme: