DROID, un outil open-source pour les archives numériques

David Clipsham

David Clipsham

Pour bien des institutions chargées de la conservation de la mémoire, les logiciels open source jouent un rôle de premier plan. La communauté archivistique doit être en mesure de partager des connaissances et de transmettre librement des idées. Au fil des ans, de nombreux logiciels open source destinés à permettre aux archives de collecter, de conserver et de donner accès aux archives numériques ont vu le jour.

Les Archives nationales du Royaume-Uni (TNA) sont responsables du développement et de la maintenance du logiciel open source appelé DROID, ressource qui peut être utilisée pour toutes les archives numériques, indépendamment de leur lieu de conservation. Et en mai 2020, TNA a eu la satisfaction de pouvoir dévoiler sa toute dernière version de cet outil (DROID 6.5).

DROID est un outil d’identification automatique de formats de fichiers. Il est capable de balayer un ensemble de fichiers numériques et d’identifier les différents formats qui s’y trouvent. L’identification précise de formats est un enjeu majeur dans l’organisation de la conservation d’archives numériques. Savoir quels sont les types de données qui sont à conserver vous permet de mieux appréhender les risques et de prévoir les actions nécessaires pour garantir l’accès, aujourd’hui et demain, à vos fonds numériques.

Lancé en 2005, DROID a toujours été un outil open source, son code source ayant été publié initialement sur la forge logicielle SourceForge. Depuis 2012, le code source de DROID est hébergé sur le site GitHub, l’outil lui-même étant téléchargeable librement sur le site web des Archives nationales (TNA).

Même si l’on doit l’essentiel de la mise au point du logiciel DROID aux collaborateurs des Archives nationales du Royaume-Uni, de nombreuses autres personnes ont contribué à ce logiciel. Ces personnes externes à TNA nous signalent d’éventuels problèmes, nous aident lors des phases de test et parfois même proposent des lignes de code pour ajouter de nouvelles fonctions DROID, corriger les bogues ou ajouter des versions localisées ou proposent d’améliorer la qualité du code grâce à des tests supplémentaires. Parmi les 13 personnes qui ont participé à la mise au point de notre toute dernière version, presque la moitié étaient des contributeurs externes.

Les données utilisées par DROID à des fins d’identification de formats de fichiers proviennent du registre de formats de fichiers PRONOM, également tenu par TNA. PRONOM est basé sur le principe de la collaboration participative et tout le monde peut y contribuer. À ce jour, plus de 60 institutions à travers le monde ont alimenté PRONOM en données.

Au sein de la communauté de la conservation numérique, il existe de nombreuses autres initiatives, par exemple Software Heritage, projet d’archive universelle des logiciels qui a pour but de collecter et préserver le code source de tous les logiciels disponibles publiquement. Le code source de DROID est également conservé dans cet important fonds.

La volonté du mouvement open source a toujours été de placer la transparence et la collaboration au cœur du développement des logiciels et, de toute évidence, la démarche ouverte adoptée dès le départ pour le développement de l’outil DROID a eu des retombées positives. Nous bénéficions de toutes les forces qu’offre une logique communautaire : partage de connaissances, renforcement réciproque du savoir. Et tout cela nous permet de réaliser des exploits hors de la portée d’une institution chargée de la conservation de la mémoire seule dans son coin.