Présentation du projet

Le projet vise à constituer un corpus numérique autour de l’Histoire de la Révolution française de Jules Michelet.
Il s’agit de numériser sept corpus différents, de façon à permettre leur mise en relation et leur interrogation transversale. Il est également prévu de pouvoir interroger chacun d’eux séparément.
Au centre du projet se trouve l’exploitation d’un corpus manuscrit qui n’a pas encore été dépouillé, les six volumes de notes préparatoires à l’Histoire de la Révolution, conservés à la Bibliothèque historique de la Ville de Paris.
La transcription et l’indexation de ces quelque 1500 feuillets représentera un travail important, susceptible de mieux faire connaître les sources documentaires sur lesquelles l’historien s’est appuyé, mais surtout sa méthode de travail et le(s) type(s) d’usage qu’il fait de ces sources. La transcription des feuillets portant des plans apportera un éclairage nouveau sur la structuration progressive de la réflexion historique ainsi que sur les principes poétiques et rhétoriques qui ont pu guider la maturation de la pensée.
La numérisation de ces notes, du manuscrit, des deux éditions parues du vivant de l’auteur, des cours au Collège de France consacrés à la Révolution française, des années du Journal de l’historien contemporaines de son travail sur la Révolution et enfin des passages de sa Correspondance concernant l’élaboration et la réception de cette œuvre, permettront de mettre à la disposition des chercheurs un ensemble de documents retraçant la genèse d’une œuvre fondamentale, dans ses dimensions historiographique et littéraire.
Le corpus numérique, que l’on souhaite évolutif, intégrera un volet iconographique (reproduction des illustrations des deux grandes éditions de la fin du XIXe siècle) ainsi que des liens vers d’autres histoires de la Révolution du XIXe siècle (Mignet, Thiers, Lamartine, Louis Blanc, Quinet…), de façon à faire apparaître le dialogue entre les différents récits et les enjeux polémiques de leurs variations.
À terme, il s’agirait de constituer un véritable portail numérique de l’historiographie de la Révolution française au XIXe siècle.

Fonds concernés : Les sources du corpus LAFAVREV peuvent être regroupées en quatre ensembles :

  • Le premier concerne le cœur du corpus et regroupe l’édition Chamerot de l’Histoire de la Révolution française publiée entre 1847 et 1853 et l’édition Lacroix publiée en 1868-1869 ;
  • Le second concerne les sources dites génétiques et regroupe le manuscrit de l’HRF et les Notes préparatoires ; l’édition critique inédite de l’HRF réalisée en 1989 sous la direction de Paul Viallaneix (dont le manuscrit complet se trouve à la Bibliothèque Jacques-Seebacher de l’université Paris-Diderot) ;
  • Le troisième concerne les sources dites périphériques et regroupe des parties de la Correspondance et du Journal, et certains cours au Collège de France ;
  • Le quatrième concerne les sources dites externes et regroupe l’iconographie liée à l’HRF, d’autres œuvres de Jules Michelet (Le Peuple, Histoire de France), les Histoires de la Révolution française écrites par des contemporains de Michelet (Thiers, Lamartine, Buchez, Quinet, Mignet, Louis Blanc…), les articles de presse parus à l’époque de la publication.

Contexte scientifique et institutionnel : Partenariat avec la Bibliothèque Historique de la Ville de Paris, le Musée Carnavalet, les universités de Rouen (GRHIS) et de Clermont-Ferrand (CHEC), l’ITEM.

Formats et standards utilisés : Sources numérisées en JPG ou PDF. Suivant le type de source : encodage TEI ou description en EAD. Mise en ligne via XTF et TEIViewer. Exploitation TAL et textométrique via Praat, Exmerlada, Elan et WinPitch (préférence accordée au logiciel WinPitch développé par Philippe Martin, membre de l’équipe de recherche du projet).

Accessibilité : Les ouvrages numérisés sont libres de droit et donc librement accessibles. Les métadonnées restent la propriété intellectuelle de l’équipe de recherche qui les a produites, mais seront néanmoins librement accessibles et moissonnables. Toutefois, une réflexion devra être menée pour élaborer le mapping entre formats utilisés pour l’encodage initial (TEI EAD) et format d’exposition.

Volumétrie des ressources qui seront disponibles en ligne (estimation au 15 mars 2013) :

  • en mode image : Si un redéploiement du budget est nécessaire, certaines sources ne seront accessibles qu’en mode image et ne seront pas intégrées à l’édition électronique en TEI. La solution de remplacement envisagée est, pour l’heure, la constitution d’un catalogue XML/EAD permettant de renvoyer aux pages concernées. Cette opération pourrait concerner au maximum 2 000 à 3 000 pages (qu’il faudrait retrancher des pages annoncées ci-dessous disponibles en mode texte).
  • en mode texte : Environ 11 000 pages seront disponibles (8 000 transcrites par OCR et 3 000 transcrites manuellement).
  • en base de données : Dictionnaire notionnel (200 notices minimum) ; base de données iconographique (250 images) ; base de données Revue de presse (100 articles et notices descriptives correspondantes)