Related projects
Discover more projects across a range of sectors and discipline — from AI to cleantech to social innovation.
L’Institut généalogique Drouin (IGD) possède la collection de documents généalogiques la plus vaste au Canada. Une collection composée de plusieurs de millions de documents historiques de natures et de longueurs très variées. Bien qu’elle soit aujourd’hui entièrement numérisée, la majorité de cette collection ne peut malheureusement être intégrée dans les outils de recherche développés par l’IGD pour sa clientèle de généalogistes, puisque les documents ne sont ni transcrits ni indexés. Or, étant donné l’ampleur de la collection, la transcription manuelle des documents n’est pas une option réaliste.
Le stage vise l’exploration et la comparaison de différentes technologies de reconnaissance optique des caractères (ROC), dans le but d’en tester la viabilité pour la transcription de divers types d’archives et de documents historiques du Québec et des environs. Le logiciel Transkribus de reconnaissance des écritures manuscrites (REM), développé par la coopérative européenne READ-Coop, sera le principal logiciel testé, mais ses performances seront comparées avec celles d’autres logiciels de ROC et de REM, afin d’aider l’IGD à identifier les meilleures solutions technologiques pour transcrire et indexer sa collection.
Maxime Gohier;Lisa Dillon
Institut généalogique Drouin
Sociology
Information and cultural industries
Université du Québec à Rimouski
Accelerate
Discover more projects across a range of sectors and discipline — from AI to cleantech to social innovation.
Find the perfect opportunity to put your academic skills and knowledge into practice!
Find ProjectsThe strong support from governments across Canada, international partners, universities, colleges, companies, and community organizations has enabled Mitacs to focus on the core idea that talent and partnerships power innovation — and innovation creates a better future.