Modèle de mélange avec noyaux pour la classification des données de grande dimension

Les données qu'on rencontre aujourd'hui sont souvent de grande dimension. Avec les données génétiques, les signaux et les images, des méthodes d'analyse qui tiennent compte de la taille des données est plus que jamais nécessaire. Chez Hydro-Québec, une nouvelle méthode de surveillance des équipements électriques a été développée, qui fait appel à la théorie de la communication. Cette méthode a mis en évidence l'utilité de tenir compte du comportement des données aléatoires dans un espace de grande dimension, bien connu en théorie des communications. En adaptant des méthodes de classification existantes pour tenir compte de ce comportement, on pourrait les améliorer. Les méthodes que nous voulons adapter sont basées sur des modèles de mélange. Ils sont très flexible dans le sens qu'ils accommodent des données complexes comme celles provenant de l'expression génique, et elles sont compétitives d'un point de vue du temps de calcul, ce qui est important lorsqu'on traite avec des données volumineuses de grande dimension.

Intern: 
Bertrand Saulnier
Faculty Supervisor: 
Alejandro Murua
Project Year: 
2014
Province: 
Quebec
Sector: 
Discipline: 
Program: