07 octobre 2013

Il est interdit d'écrire de l'EAD à la main ! Exemple d'un guide des fonds Excel mué en EAD pour le Portail Européen des Archives

Pour citer Bibliothèques [reloaded] : "L'EAD est un très bon format d'échange entre deux bases d'archives, pour partager un inventaire. Mais ça ne sert à rien d'en faire un format natif". Pour faire une comparaison plus compréhensible aux bibliothécaires (enfin, aux bibliothécaires qui lisent ce blog) : c'est un peu comme si on demandait à un catalogueur d'écrire ses notices en iso2709 ou en MarcXML. Il vaut mieux consacrer du temps à savoir produire automatiquement de l'EAD à partir d'un autre format, que de le passer à taper les balises et attributs à la main".

Voici pour compléter son billet des modèles de tableurs Excel (extraits de bases de données), et feuilles de style (moulinette) XSL permettant de transformer des bases de données, de massifs inventaires ou des ensemble d'inventaires Excel en EAD minimaliste suffisant pour entrer dans le portail européen des Archives (voir Bibliothèques [reloaded] pour l'explication de chaque étape : publipostage, etc...) et sans aucun logiciel propriétaire ou payant (et même sans Pleade).

Un guide des fonds (d'Excel en EAD)

Au point de départ se trouve une base de données capable de produire des extractions en format Excel à plat, avec une ligne par notice. A l'arrivée, l'objectif est de les regrouper par tranches de cotes, séries et sous-séries, pour charger le résultat dans le portail européen des archives.

Exemple d'une extraction de base de données en tableau Excel qui peut être récupéré et réutilisé : liste des colonnes exportées
  • Cote de début : H 0001
  • Cote de fin : H 1508
  • Série : H : Clergé régulier
  • Origine : Abbaye de Saint-Glinglin..
  • Analyse (détail ou résumé sur le fonds)  L'abbaye a été créée en 1005 et supprimée en 1787. Le fonds composé 50 mètres a été retrouvé en 1861 dans les greniers de la mairie, dans des cageots à raisins, sous un toit,  à demi-rongé par de voraces rats, desséchés par le soleil provençal, graissé par un séjour séculaire dans l'office de l’abbaye, dans le coffre à lard, etc. Il comprend d'intéressantes délibérations, séries de comptes et de bulles pontificales
  • Date début : 05/06/1005
  • Date fin : 31/12/1787
  • Date versement : 01/01/1861
  • Note (référence si l'inventaire est une publication du XIXe siècle, etc.) : H. MORIS, Inventaire sommaire des Archives départementales antérieures à 1792, Archives ecclésiastiques, Série H, Saint-Glinglin, 1893, in-4°, XXVI-248 p.
  • Lien vers l'inventaire original en ligne (doté au besoin des numérisations) : http.//archives.cgXX.fr....
Le publipostage sous Word va permettre d'éditer chaque ligne du tableau en notice à plusieurs lignes avec des balises. Le fichier modèle de publipostage va chercher dans les différentes cases pour présenter chaque notice ainsi. Apparaissent en grisé les en-têtes de colonnes dont les contenus sont appelés dynamiquement :



L'inventaire Excel publiposté est devenu un ensemble de notices balisées à récupérer et copier tel quel dans un éditeur XML (avec simple rajout d'une balise racine pour englober tous les générés), par exemple XML Copy Editor. Voici l'exemple d'une notice : 


  


On lui applique une feuille de conversion XSL spécifique qui va appliquer un traitement de masse aux notices pour en faire un fichier d'EAD prêt à charger dans le portail européen des Archives. On ouvre pour cela notre éditeur XLM (XML Copy Editor) --> aller dans XML/Transformation XSL, et sélectionner la feuille de style. 
Elle ordonne notamment au premier fichier XML :
 - que les notices se regroupent bien par séries 
 - que les séries se rangent dans l'ordre canonique des archivistes (A, B, C, D, ...Y, Z)



Attendez quelques minutes... le fichier EAD est prêt... Servir bien chaud dans le portail européen des Archives, Pleade ou autre outil de publication EAD. Bonne dégustation !


Petites choses à voir en amont pour un traitement propre : 
  • ici pour l'extraction les sauts de ligne de l'inventaire, dans un champs ou une colonne ont été remplacés par des "__". La feuille XSL convertit ces "__" en balises
    qui génèrent des sauts de ligne à l'affichage dans les pages web.
  • la présence de "&"  doit être remplacée (par chercher-remplacer) en "&" pour un affichage final correct après conversion en pré-XML

Prochainement  ....
  • Un inventaire (ou base de données) d'archives anciennes d'Excel en EAD
  • Un inventaire (ou base de données) d'archives notariales d'Excel en EAD
  • Un inventaire (ou base de données) d'archives communales d'Excel en EAD
  • Un inventaire (ou base de données) d'affiches d'Excel en EAD

Aucun commentaire: