La généalogie au Québec et la révolution des données de masse : mobiliser des partenariats pour comprendre le passé

L’Institut généalogique Drouin (IGD) possède la collection de documents généalogiques la plus vaste au Canada. Une collection composée de plusieurs de millions de documents historiques de natures et de longueurs très variées. Bien qu’elle soit aujourd’hui entièrement numérisée, la majorité de cette collection ne peut malheureusement être intégrée dans les outils de recherche développés par l’IGD pour sa clientèle de généalogistes, puisque les documents ne sont ni transcrits ni indexés. Or, étant donné l’ampleur de la collection, la transcription manuelle des documents n’est pas une option réaliste.Le stage vise l’exploration et la comparaison de différentes technologies de reconnaissance optique des caractères (ROC), dans le but d’en tester la viabilité pour la transcription de divers types d’archives et de documents historiques du Québec et des environs. Le logiciel Transkribus de reconnaissance des écritures manuscrites (REM), développé par la coopérative européenne READ-Coop, sera le principal logiciel testé, mais ses performances seront comparées avec celles d’autres logiciels de ROC et de REM, afin d’aider l’IGD à identifier les meilleures solutions technologiques pour transcrire et indexer sa collection.

Intern: 
Émilie Cormier
Superviseur universitaire: 
Maxime Gohier;Lisa Dillon
Province: 
Quebec
Partner University: 
Discipline: 
Programme: