*Les liens figurant dans ce billet de blog mènent vers des pages en anglais uniquement.
Il y a une dizaine d’années, des archivistes de l’université Stanford ont reconnu l’importance de la conservation des courriers électroniques et de leur accessibilité pour les chercheurs. Nous avons effectué une enquête sur le terrain et découvert que tous les projets antérieurs avaient été axés sur la conservation et non sur la consultation ou l’accès à ces documents. En 2011, de manière assez fortuite, nous avons fait la rencontre de Sudheendra Hangal, à l’époque doctorant en sciences informatiques à Stanford, qui avait créé MUSE, un programme informatique servant à passer en revue les courriers électroniques personnels archivés. Ce programme possédait des fonctionnalités uniques et nous permettait d’examiner des images et du texte en vue de localiser des contenus sensibles. L’envoi d’archives constituées de courriers électroniques aux chercheurs pouvait s’effectuer via un système autonome depuis notre salle de lecture.
Nous étions tous fascinés par l’idée de développer davantage ce logiciel pour en faire un outil open source plus stable. Avec le concours de Sudheendra, nous avons fait notre première demande de subvention auprès de la NHPRC (National Historical Publications and Records Commission, Commission pour les publications et archives nationales et historiques). Deux ans plus tard, en 2015, nous avons lancé un prototype de base d’ePADD (Email : Appraise (Sélection) ; Process (Traitement) ; Discovery (Recherche) ; Deliver (Communication). Nos principaux objectifs étaient de pouvoir rechercher des contenus sensibles et à caractère personnel et d’apporter davantage de flexibilité dans les stratégies de recherche. La conception d’un site de recherche était également importante et s’appuyait sur le postulat que seule la publication de métadonnées permettrait aux chercheurs d’accéder aux contenus.
Nous avons ensuite obtenu une subvention de l’IMLS (Institute of Museum & Library Studies, Institut pour les études en muséologie et bibliothéconomie) pour la période de 2015 à 2018 pour poursuivre le développement d’ePADD et élargir notre communauté d’utilisateurs. Pour le module de recherche en ligne, nous avons dû garantir aux donateurs ainsi qu’à nos directeurs de bibliothèques que seules des métadonnées descriptives seraient publiées, un engagement que nous avons maintenu dans notre version actuelle (version 7.2) téléchargeable depuis le site GitHub.
Nous avons reçu cette année une subvention de la Fondation Andrew W. Mellon et nous sommes de nouveau associés à la Bibliothèque d’Harvard pour la poursuite de ce projet. Nous avons pour principal objectif de revoir la fonctionnalité permettant d’examiner des pièces jointes, car elle s’appuie sur Adobe Flash dont la fin de vie est programmée en décembre. Notre solution innovante consiste à former un comité de révision pour l’ensemble des pièces jointes s’appuyant sur Apache Tika pour obtenir du texte brut dans de nombreux formats de fichiers basés sur du texte.
Notre autre objectif est de collaborer avec nos partenaires au développement de fonctionnalités visant à intégrer des fonctions de conservation dans ePADD qui permettront l’exportation de documents vers des lieux de stockage. Des mois de réunions axées sur l’interopérabilité entre le système d’archivage électronique d’Harvard (EASi) et ePADD ont débouché sur cette stratégie. Des collaborateurs de l’université de Manchester se sont associés à cet effort et se sont lancés indépendamment dans le projet ePADD depuis un an. Notre collaboration avec ces deux institutions a été très fructueuse et a donné naissance à des propositions de chantiers dans le domaine de la conservation des courriers électroniques et l’extension des services proposés par ePADD à d’autres langues.
Notre dernier objectif avec cette subvention est de créer un nouveau site de recherche multi-institutionnel pour les courriers électroniques. Nous sommes actuellement en train de constituer un groupe d’utilisateurs ePADD de manière à préciser les exigences fonctionnelles des interfaces administratives et utilisateur du site et à fournir des recommandations sur la gestion et le maintien pérennes de ce dernier.
Travailler sur un projet de développement a été particulièrement intéressant cette année. Les réunions en présentiel sur plusieurs jours avec nos partenaires et développeurs ont cédé la place à des réunions virtuelles plus fréquentes. Et le pilotage d’un projet entièrement virtuel lui aussi s’est révélé bien plus simple que prévu.
Glynn Edwards, Directrice déléguée aux Collections spéciales et aux Archives universitaires, bibliothèques de Stanford, université Stanford