Partager nos codes, la clé du succès

Dans le cadre du ANR DIVITAL (Increase the digital vitality and visibility of languages of France), impliquant quatre laboratoires à travers la France, nous harmonisons nos pratiques pour permettre le croisement de nos expertises et de nos données.

Nous le faisons à travers l’utilisation de nomenclatures communes (thésaurus du consortium CAHIER) et de formats standards de structuration (comme la XML-TEI) qui nous permet de réellement collaborer et avancer ensemble. Pour arriver à transformer nos anciennes données et en produire de nouvelles compatibles entre elles, nous avons partagé nos méthodes (comme par exemple la constitution d’une base de données Heurist) et surtout nos codes sources (scripts) sur la forge logicielle nationale GitLab Huma-Num (comme ceux visant la création de fichiers XML déversés sur la plateforme de corpus parallèles Parcolab).

Marianne Vergez-Couret