Inference faiblement supervisee de roles semantiques a partir de documentsspecialises

L’extraction d’information est un processus de structuration de I’information pertinente de documents et elle est

un element cle des applications gerees par KEATEXT. Elle est constituee de trois etapes : extraction des entites

nommees, identification de patrons d’extraction pour detecter leur role et fusion des informations des entites

autour d’evEmements. Ce stage est consacre a la deuxieme etape, celie de I’annotation semantique des

documents avec des roles. Ce probleme est tres difficile a traiter dans Ie cas general, mais nous pensons

pouvoir proposer une solution viable pour des domaines specialises, p.e. medical ou juridique. Les roles

representes par des classes semantiques sont dependants du domaine. Par exemple, pour des documents

composes d’actes notaries de ventes d’immeubles, ces roles pourraient etre Vendeur, Acheteur, Bien_achete,

MontanCde_ Vente.

Faculty Supervisor:

Guy Lapalme

Student:

Partner:

Keatext

Discipline:

Computer science

Sector:

Manufacturing

University:

Université de Montréal

Program:

Accelerate

Current openings

Find the perfect opportunity to put your academic skills and knowledge into practice!

Find Projects