Document Understanding
La gestion du contenu numérique (documents, captures d’écran, pages web, etc.) répartie sur de nombreuses applications et plateformes devient un problème omniprésent tant pour les professionnels que pour les entreprises. La plupart des solutions existantes se concentrent sur le stockage et la distribution du contenu numérique, et il existe encore un manque sur le marché pour un outil qui répond au problème de gestion du contenu en comprenant leur contenu textuel. Charli AI s’efforce de combler ce manque en offrant une plateforme facile à utiliser pour tout ce qui touche au contenu; comme l’organisation du classement/dossiers, la recherche optimale, la collaboration d’équipe, ainsi que les analyses et actions comme les rapports et rappels.
Nous proposons d’appliquer un ensemble d’études empiriques pour la classification des documents et l’extraction d’informations à partir de ces documents. Plus précisément, des modèles de langage au niveau des personnages, des modèles de langage neuronaux pré-entraînés et des techniques d’apprentissage par transfert en réglages zero shot et peu shot seront étudiés. Les études visent à déterminer la meilleure intégration de documents pour la classification des documents, ainsi que les modèles de reconnaissance d’entités nommées pour l’extraction d’informations.
Fatemeh Hendijani Fard
Charli
Informatique
Industries de l’information et culturelles
L’Université de la Colombie-Britannique - Okanagan
Accélération