Réutiliser des données, la clé du succès

Dans le cadre du projet ANR LEXique d’Interaction Kinesthésique Humain-Machine (LexiKHuM), nous devons avoir recours à des enregistrements vidéo de personnes sourdes en train de signer en langue des signes et de personnes entendantes en train de parler en français. Nous avions conscience que produire ce genre de captation est sensible et nécessite une « mise en conformité des traitements (RGPD)».

C’est en écrivant notre Plan de Gestion de Données et plus particulièrement en nous interrogeant sur l’entrepôt de donnée qui serait le plus adapté à valoriser ce contenu, que nous avons découvert qu’avait été déposé dans l’entrepôt de ressources linguistiques ORTOLANG un corpus vidéo (DEGELS1) particulièrement pertinent pour notre projet. Grâce aux formats de fichiers interopérables et à une licence permettant la réutilisation, nous avons décidé de réutiliser ce corpus plutôt que d’en produire un nouveau.

Claudia S. Bianchini