NUMérisation de Documents Anciens Mathématiques
Résumé
Ce travail a été confié à la cellule Mathdoc qui, au sein du CNRS, est chargée de piloter ce programme spécifique. L’objectif poursuivi est d’assurer la conservation d’un fonds, toujours d’actualité dans cette discipline, et de maintenir la visibilité des revues françaises au sein du patrimoine numérique mondial. Les articles des cinq revues qui font l’objet de la première phase du projet seront librement accessibles à partir d’un délai adapté à chacune d’entre elles afin de ne pas ébranler leur stabilité économique. Le choix technique s’est porté sur des formats standards facilement convertibles (tiff, xml), sur des images de qualité permettant une reconnaissance optique des caractères et une recherche plein texte (sauf pour les formules mathématiques), et sur une segmentation par unités logiques. Les textes sont accompagnés d’une base de données bibliographiques en libre accès proposant des liens croisés avec des bases de recensement grâce à un format d’échange des données structurées (xml selon une dtd mise au point par la cellule Mathdoc). Ces choix techniques visent la qualité et la pérennité. Ils devraient pouvoir être appliqués à la deuxième phase du projet qui consistera à élargir le champ du domaine mathématique concerné par le plan de numérisation.