Développement d’un outil d’analyse de texte assistée par ordinateur permettant de classifier les entreprises dans l’écosystème de la 5G au Canada

Prompt doit identifier les PME qui ont un fort potentiel de croissance au sein de l’écosystème canadien de la 5G. Dans ce contexte, la recherche propose d’exploiter une base de données textuelles. Elle est constituée par les sites internet de 7 000 entreprises. Cette base de données a déjà été construite par Prompt. Le premier but de l’analyse est l’exploration des spécificités thématiques des sites internet et leur classification par groupe d’entreprise. Plusieurs algorithmes et méthode statistiques venant du domaine de la fouille de texte (ou text mining) et du traitement automatique du langage naturel (ou Natural Language Processing – NLP) seront utilisés à cet effet. En particulier, les méthodes de fouille de thème (ou topic modeling) seront utilisées pour explorer les données textuelles.

Faculty Supervisor:

Catherine Beaudry

Student:

Alvar Herrera

Partner:

PROMPT

Discipline:

Engineering - other

Sector:

Professional, scientific and technical services

University:

École Polytechnique de Montréal

Program:

Accelerate

Current openings

Find the perfect opportunity to put your academic skills and knowledge into practice!

Find Projects