Using Natural Language Processing to Detect Dataset Re-use in the Scientific Literature
Cette recherche vise à s’attaquer à l’un des problèmes les plus difficiles de la science ouverte, c’est-à-dire comment s’assurer de manière fiable que les auteurs partagent tous les ensembles de données, le code, les protocoles et tout nouveau matériel de laboratoire associé à leurs articles. La solution utilisera des techniques de traitement du langage naturel de pointe pour détecter les phrases où les auteurs décrivent la collecte de données ou la génération d’autres résultats de recherche, et vérifier si ces résultats sont partagés publiquement. Cette solution peut aussi être appliquée à la détection de code et de logiciels, de protocoles et de matériel de laboratoire. Les auteurs sauront si toutes les ressources existantes réutilisées sont correctement citées dans leur publication. Ainsi, les résultats de la recherche faciliteront la gestion, le partage et la citation des données au sein de la communauté de recherche et soutiendront l’infrastructure numérique de recherche du Canada.
Voir la description complète du projetZheng Liu
DataSeer
Génie
Services professionnels, scientifiques et techniques
L’Université de la Colombie-Britannique - Okanagan
Accélération