Umaneo : Identifier les requis d’un appel d’offres

L’objectif de ce stage est de développer une méthode et un prototype pour le repérage automatique des requis dans des appels d’offre par apprentissage automatique avec un réseau de neurones. Les données proviendront d’une banque d’appels d’offres du gouvernement fédéral. Dans un premier temps, le travail sera réalisé avec des appels d’offres en anglais, mais le site du gouvernement fédéral permet également de récupérer la version française de chaque document, ce qui pourrait être intéressant dans le futur. Grâce à l’implémentation de Word2Vec dans la librairie Gensim [25], une analyse sémantique latente (latent semantic analysis) des mots sera faite [20]. Il s’agit ici d’examiner les relations reliées au contexte plutôt qu’à la synonymie ou à l’hyperonymie. Ces relations peuvent être extraites à partir d’un grand corpus de textes. Un modèle Word2Vec sera donc entraîné sur l’ensemble des documents pour identifier les mots qui apparaissent souvent dans un contexte similaire. Cela permettra de créer un dictionnaire avec des relations entre les mots qui sera ensuite utilisé pour la production automatique de règles et l’entraînement d’un réseau de neurones. La base de données lexicales WordNet [27] sera également utilisée dans les mêmes fins que Word2Vec.

Faculty Supervisor:

Christian Gagné;Luc Lamontagne

Student:

Partner:

Umaneo

Discipline:

Computer science

Sector:

Information and cultural industries; Professional, scientific and technical services

University:

Université Laval

Program:

Accelerate

Current openings

Find the perfect opportunity to put your academic skills and knowledge into practice!

Find Projects