EAD s'invite dans la famille MARC (1/2)

jacques villeret dans un diner de consAvec l’aboutissement  des projets de rétro conversion du répertoire des manuscrits littéraires (Palme) et du catalogue général des manuscrits des bibliothèques publiques de France, un certain nombre d’établissements ont pu récupérer les fichiers codifiés en EAD correspondant aux documents de leurs collections. Mais avec ces données sont arrivées de nouvelles missions.

Dans son article du BBF 2009, t.54,n°1, Florent Palluault précise : « les notices en EAD seraient fournies aux établissements conservant les manuscrits afin qu’elles puissent être corrigées et que de nouvelles notices décrivant les manuscrits acquis depuis la publication des derniers suppléments imprimés puissent être ajoutées »
Pour assumer ce travail de mise à jour des descriptions existantes ou de création, les bibliothèques vont donc devoir acquérir de nouvelles compétences pour encoder en EAD et disposer d’un outil informatisé pour la saisie ou la publication.
Les fonds décrits faisant partie des collections, on pourrait espérer disposer d’un outil informatique permettant de travailler indifféremment en MARC ou en EAD.. Bien que certains éditeurs y travaillent, il n’existe pas aujourd’hui de SIGB permettant la coexistence de notices dans ces deux formats. Beaucoup de bibliothèques  sont donc à la recherche d’outils autonomes de saisie en EAD et de solutions pour la publication des références dans leur portail.
Ce premier article aborde la question de l’encodage. Dans un deuxième billet, je parlerais de la publication de ces données dans un portail de bibliothèque..
Marc et EAD : deux conceptions opposées.
Lorsque l’on catalogue en format MARC, l’unité de travail est la notice bibliographique qui décrit un document indépendamment de sa position dans un fonds. Les données locales sont renseignées dans un deuxième temps dans des champs spécifiques, avec une étiquette commençant ou contenant un 9, ou dans une notice liée pour chaque exemplaire.
La notice, débarrassée de ses données locales, constitue un ensemble qui peut alors être échangé et utilisé par n’importe quel établissement. Ce sont les champs de lien vers d’autres notices qui permettent de constituer un ensemble organisé.
Issu du monde des archives, EAD fonctionne sur une logique inverse. On ne décrit plus un document mais un ensemble : « un catalogue, un inventaire ou un répertoire de fonds d’archives, de manuscrits, ou de collection » Comme tout document XML, un encodage EAD est une arborescence. Il débute par une entête (balise <eadheader>) décrivant le fichier lui-même et les conditions de sa constitution. On passe ensuite au corpus documentaire (balise <archdesc>) divisé en composants (balise <c>) eux-même redivisés en composants, chacun d’eux étant typé : fonds, série, sous série, élément (item) ou autre. Il n’y a pas de limite de profondeur. Au dernier niveau, on trouve le document ou des notices analytiques ou de parties. Notons enfin qu’un document EAD peut englober la ressource elle-même.
Les limites des éditeurs XML.
Pour encoder en EAD, les bibliothèques doivent trouver les outils permettant de travailler en appréhendant le fonds à décrire globalement. Les volumes à saisir ou à mettre à jour ne justifient pas l’investissement dans un logiciel de gestion d’archives, qui sont à EAD ce qu’un SIGB est aux formats MARC. Il faut alors trouver, à un coût raisonnable, un logiciel simple d’usage à la portée de professionnels non-spécialistes. La plupart s’orientent vers des éditeurs XML avec une spécialisation EAD : Jaxe, XMetaL, XMLSpy, oXygen, XMLOperator, … Avec ce type de logiciels, l’intervention sur une partie nécessite la manipulation de l’intégralité du fichier, ce qui peut se révéler lourd quand le fichier est important. La logique de saisie s’apparente à celle d’un gros document fortement structuré dans un traitement de texte. Pour modifier un élément, il faut d’abord le retrouver à l’intérieur du fonds. Une modification mineure sur une partie peut remettre en cause la cohérence de l’ensemble. L’éditeur peut  vous guider en vous proposant les balises pertinentes en fonction de la position dans l’arborescence ou des valeurs possibles pour certains attributs. Malgré ces aides sommaires, la saisie nécessite une très bonne connaissance du format utilisé. C’est évidemment aussi le cas pour le catalogage en MARC. Mais ces derniers sont le quotidien d’une bibliothèque et partie intégrante de la formation. Ce n’est que par une pratique régulière qu’un professionnel peut arriver à un niveau d’encodage correct en se passant de guides et d’outils de contrôle. L’utilisation marginale d’EAD justifierait des outils limitant les risques d’erreurs et les aides au niveau de la saisie.
Un bon compromis : CD-ead.
Il y a eu longtemps une place vide entre les logiciels d’archives et les éditeurs XML. C’est là que vient se nicher CD-ead, chaîne de production et de publication EAD édité par la société  CD-script. Développé à l’origine pour l’organisation des fonds d’archives de la bibliothèque numérique de Roubaix, ce logiciel était jusqu’à présent limité dans son utilisation, en particulier pour ce qui est des niveaux de composants. La toute dernière version a été repensée pour une utilisation plus complète du format. CD-ead ne travaille pas directement en EAD. L’inventaire est organisé dans une base de données. La saisie se fait partie par partie sous formes d’onglets : l’en-tête (balise eadheader), l’archive (balise archdesc) et  les composants. Pour ces derniers, une arborescence permet de se positionner sur un composant particulier. La saisie se fait sous-forme de boites de texte ou de liste déroulante. Le fichier EAD est construit à la demande à partir de la base de données. Avec un tel logiciel, il est possible de produire un encodage de bonne qualité sans connaissance très pointue de l’EAD.
Saisie en images.
Pour illustrer en images le propos de ce billet, je vous propose cette vidéo. Vous y verrez comment ajouter des méta données sujets dans un inventaire EAD, les archives de Maxence Van Der Meersch en utilisant l’éditeur XML Jaxe et CD-ead.