La réponse visuelle aux questions (Visual Question Answering VQA [1]) a été introduite pour combler le fossé entre le traitement du langage naturel et les applications de compréhension des images dans l’espace commun de la vision et du langage. La plupart des benchmarks VQA calculent une représentation de la question en utilisant des techniques d’intégration […]
Read More