27 juin 2012

Edition collaborative de manuscrits sur Wikisource : guide pour les débutants

Des manuscrits des XVIIe-XVIIIe siècles sont offerts à la transcription sur Wikisource (des visites pastorales relatant la vie des villages des Alpes-Maritimes). 120 pages de transcriptions ont été apportées en six mois.
Voici un petit guide d'utilisation de Wikisource en 4 minutes 59 secondes à l'intention des amateurs craignant encore de dompter l'outil.
Unable to display content. Adobe Flash is required.



04 février 2012

Edition collaborative de manuscrits sur Wikisource :

Les Archives départementales des Alpes-Maritimes collaborent depuis janvier 2012 avec Wikimedia France sur Wikisource afin d'utiliser cet outil collaboratif pour transcrire des sources manuscrites autour d'une petite communauté de paléographes. Ont déjà été mises en ligne trois visites pastorales des XVIIe-XVIIIe siècles.

1. Deux bonnes raisons de se lancer dans une édition collaborative


1ère raison : valoriser un fonds riche, souvent demandé, difficile à lire et volumineux


Les visites pastorales constituent une source riche d'informations pour les érudits locaux, mais les lecteurs peinent sur les pattes de mouches, et l'ensemble est trop gros pour être édité par une personne seule. Les lecteurs, faute de parvenir à tout déchiffrer, sollicitent assez régulièrement l'aide de l'archiviste-paléographe.

Combien de fois en Archives départementales a-t-on recours aux visites pastorales ?


  • Pour une commune s'apprêtant à recevoir l'évêque et cherchant depuis quand sa rue principale s’appelle "la rue de l'évêque",

  • pour des travaux de restauration,

  • pour aider à une datation de fresques retrouvées derrière un enduit blanc ou une armoire,

  • pour un conservateur des antiquités et objets d'art préparant la protection de mobilier liturgique ? …

C'est pour cela que les Archives départementales des Alpes-Maritimes ont choisi de mettre en ligne les procès-verbaux de visites des évêchés de Vence et Grasse (situés dans l'actuel arrondissement de Grasse) : 86 petits cahiers ou registres soit 7885 images.

2e bonne raison : des cours de paléographie vite oubliés ?


D'un autre côté, les cours de lecture des écritures anciennes dispensés en Archives (dans un cadre universitaire ou amateur), forment bon an mal an une quinzaine de nouveaux paléographes chaque année... Mais quelques mois sans pratique et un don chèrement acquis vient à s'émousser.

Ce partenariat permet d'allier donc l'utile à l'agréable, la pédagogie et la découverte du patrimoine local.

2. Wikisource : l'outil idéal ?


Wikisource est au départ un projet de publication en ligne de textes libres de droit, saisis à la main ou OCRisés, donc bourrés de coquilles, auxquels les Wikisourciens rendent orthographe, typographie, etc. pour les rendre d'interrogeables en plein texte, etc.

Cela fait quelques temps que les services d'Archives cherchent des outils collaboratifs pour faciliter l'accès à leurs fonds (cf. Mayenne).

Or Wikisource dispose d'un atout considérable : il est déjà en place (pas de logiciel à inventer, maintenir, administrer, pas de cahier des charges... juste une solide volonté et un noyau dur de 2 à 6 personnes).

Il offre des fonctionnalités adaptées pour les éditions de manuscrits nécessitant plus d'une vie humaine...

Parmi les fonctionnalités particulièrement utiles (outre l'aspect collaboratif) :


  • Affichage côte à côte de l'image et du texte transcrit

  • Indication si une page est transcrite, corrigée, ou validée par deux administrateurs

  • Cette visualisation est très pratique si on anime la communauté des transcripteurs

  • L'historique de modification et la possibilité de commenter et discuter les points litigieux

  • Le bon PageRank de Wikisource sur Google…


3. Quel(s) corpus choisir ?


Critères :


  • des textes à l'écriture relativement accessible (à partir de 1660)

  • susceptibles d'intéresser une communauté de paléographes pré-existante et variée, par exemple fondée sur l'histoire locale

  • susceptibles d'intéresser une communauté de lecteurs qui bénéficieront du travail effectué

A mon sens : correspondances diplomatiques et politiques, livres de raison, visites de lieux, statistiques d'intendants, inventaires de mobilier, inventaires après décès de collectionneurs, sont si riches et ont leur place ici...

(Avis aux Archives du ministère des Affaires étrangères ou autres lieux qui voudraient voir édités des passages de correspondances intéressantes avec le comté de Nice par exemple...)

4. Par où commencer ?


Le plus prudent est de se familiariser avec les règles de Wikisource :


Puis prise de contact avec Wikisource pour :


  • Proposer ou définir ensemble le corpus envisagé. L'aide peut être légère ou importante au début selon les besoins.

  • Décrire la communauté des internautes qui viendront participer à la transcription (elle doit être pré-existante au projet : elle ne se constituera pas toute seule lors de son lancement par génération spontanée !)

Vous pouvez ensuite vous lancer en publiant de courts textes : le fichier à mettre en ligne doit être du PDF multipage contenant l'ensemble des images numérisées.

A savoir : étant donné l'interface de saisie en ligne, une image doit contenir une seule page (pas de photo de double page)

5. Comment motiver vos paléographes ?


Dans l'expérience des AD06, les transcripteurs sont essentiellement d'anciens élèves d'Université et des archivistes formés en interne, qui souhaitent prolonger ainsi leur formation reçue en cours (soit pour progresser, soit pour ne pas régresser)

Des moments de présence et des moments de repos clairement définis à l'avance

Un délai régulier fixé d'avance à date fixe (par exemple un mois : mise en ligne le 15 et correction chaque dernier jour du mois) aide le groupe à progresser et à scander ses efforts avec moments de relâche (pour les yeux, les contributeurs et correcteurs) et permet à chacun d'avoir sa correction rapidement (les nouvelles pages sont de fait corrigées pratiquement chaque soir).

6. Constatations sur le comportement des "élèves" sur Wikisource


Les premiers exercices attirent l'aide bienveillante et soutenue des habitués ou administrateurs de Wikisource (Adrienne Alix, SereinWMfr, Pyb, Hsarrazin), quelques nouveaux paléographes authentifiés (Cavalié, LINCK, Braxmeyer, Gustave) et des IP anonymes. Un ou deux correcteurs peuvent suffire sans peine pour accompagner le travail de 5 à 10 "élèves". Contrairement aux devoirs réalisés en cours, les "élèves" s'acquittent régulièrement de leur tâche, et la saisie et le nombre de contributeurs n'augmente à la veille de l'échéance.

Les écritures antérieures à 1660 recueillent moins d'amateurs volontaires mais peuvent en revanche très bien servir pour des exercices universitaires notés en ligne (à raison d'une page par étudiant).

7. Les fruits immédiats


Quelques jours après publication du texte, en faisant une petite enquête hasardeuse d'histoire de l'art sur des objets mobiliers, en tapant simplement sur Google "Saint-Jeannet / reliquaire", on voit très vite la bonne indexation du travail qui est disponible à tous, en meilleure position que s'il était publié en version papier ou sur notre site Internet : la base de données des objets classés (sur Culture.fr/collection) apparaît en 2e résultat, et le passage de Wikisource concernant les reliquaires inspectés en 1765 en 5e position !

On laisse désormais à l'historien d'art le plaisir de se pencher sur le texte transcrit et de dépoussiérer les murs de la chapelle Sainte-Barbe dans le village de Saint-Jeannet dont on a appris durant l'exercice que les peintures indécentes ont été passées à la chaux ... Il n'y a pas encore eu de prospection à ce sujet ! Il reste une rue et place Sainte-Barbe dans le village... A suivre...

Pour en savoir plus sur le projet (ou pour le savoir en résumé).

For a translation in English : see the post "French Departmental Archive on Wikisource"

13 février 2011

Qui veut faire numériser ses livres par Google Books ?

Grand amateur de Google Livres couplé avec Books Ngram Viewer, et par ailleurs d'aérostation pour des raisons à paraître en octobre 2011... voici une petite découverte de perfectionnements à apporter au système de tournage de page automatisé mis au point par Google pour numériser des livres (de souvenir, le souffle d'une machine permet de tourner les pages et de gagner un temps précieux...)

En général cela marche bien mais quid des réglages pour les planches artistiques ou scientifiques à déplier en fin de volume qui pèsent plus lourd et ont du mal à tourner ... Réponse avec ces extraits du magnifique Nouveau manuel complet d'aérostation ou Guide pour servir à l'histoire et à la pratique des ballons, publié par Dupuis-Delcourt en 1850 et appartenant à l'Universidad Complutense de Madrid

Le tout doit être soigneusement refermé et écrasé depuis la numérisation !
A moins que ce ne soit une nouvelle technique pour numériser deux images en une ...?





13 mai 2010

Prix des meilleurs sites d'Archives français 2010

Comme chaque année va avoir lieu le Prix des meilleurs sites d'Archives, les "Best Archives on the Web awards". Les Anglosaxons sont en général majoritairement récompensés.

Pour être en lice pour les nominations 2010, dites-en plus sur votre ou vos sites d'Archives français préférés... en répondant à l'une ou l'autre question... avant le 30 mai (date de remise des candidatures pour les nominations américaines...). Vos commentaires leur permettront aussi de progresser pour 2011 !

Toutes les réponses sont consultables sur tableur et mieux présentées mais en sélection ici.