Des corpus d'auteurs pour les humanités à leur exploitation numérique
7-10 juin 2021 Bordeaux (France)
L'édition critique multimodale de sources anciennes : une recherche collaborative pour la création de nouveaux outils
Marie-Agnès Lucas-Avenel  1, *@  , Marie Bisson  2@  
1 : Centre Michel de Boüard - Centre de recherches archéologiques et historiques anciennes et médiévales  -  Site web
Université de Caen Normandie, Centre National de la Recherche Scientifique : UMR6273
2 : Maison de la recherche en sciences humaines  -  Site web
Université de Caen Normandie, Centre National de la Recherche Scientifique : USR3486
* : Auteur correspondant

La situation des études visant à l'édition scientifique numérique des sources anciennes est paradoxale : l'accès en ligne aux textes anciens grâce à la numérisation des collections et des témoins manuscrits ainsi que leur insertion dans des bases de données permettent de démultiplier les modes d'interrogations et les recherches pluridisciplinaires sur ces sources, dont la lecture est indispensable à la connaissance des époques anciennes et médiévales. En outre, les spécialistes de ces périodes, qu'ils soient historiens ou littéraires, ont développé depuis plusieurs années des outils informatiques performants pour leurs recherches (en France, par exemple, les sites Ménestrel et celui de l'Equipex Biblissima, ainsi que ceux créés par l'IRHT ou le département des manuscrits de la BNF). Pourtant, très rares encore sont les projets qui aboutissent à de nouvelles éditions critiques numériques de sources anciennes et médiévales[1]. Parmi les diverses raisons, on peut invoquer l'aspect chronophage de ce type de recherches[2], qui s'accommode mal d'une programmation de la recherche sur des contrats courts. Néanmoins, la collaboration qui a été mise en place à Caen entre le CRAHAM (UMR 6273), le Pôle Document numérique (PDN) de la Maison de la Recherche en Sciences de l'Homme (USR 3486) de l'Université de Caen Normandie – en lien avec des consortiums nationaux et internationaux (Huma-Num, Equipex Biblissima, GDRI Zoomathia) – et les Presses universitaires de Caen (PUC) a permis de mener une réflexion sur le choix et l'utilisation des outils et de proposer de nouvelles pratiques. Suivant une démarche à la fois empirique et heuristique, cette collaboration a abouti à la création d'environnements numériques en XML-TEI outillant la recherche pour la réalisation d'éditions de sources, avec des retombées importantes aussi bien pour l'éditeur scientifique que pour les lecteurs (chercheurs et autres). Certaines des préoccupations de l'éditeur scientifique rejoignent en outre celles de l'éditeur matériel, qui l'un et l'autre veulent permettre aux lecteurs d'aujourd'hui d'accéder au texte ancien. Cela suppose, en partie, d'extraire le texte, dans ses différents états, de tout ce qui le rend abscons aux non spécialistes, en particulier la multiplicité de ses réalisations sur des supports variés, pour le restituer sous une autre forme et sur un autre support, papier ou numérique, tout en rendant compte de l'histoire du texte, de ses spécificités et des choix qui ont présidé à la conception de l'édition.

La communication présentera d'abord le contexte scientifique qui a permis de mettre en place ce partenariat interdisciplinaire (recherche philologique, ingénierie de recherche en humanités numériques et ingénierie en édition matérielle multimodale), puis exposera certains des résultats obtenus, grâce à ce partenariat, dans le domaine de l'ecdotique outillée par ordinateur : on montrera en particulier combien la création d'un environnement XML dédié facilite et rend plus sûr le travail qui consiste à établir le texte et multiplie les possibilités de recherche sur la source et ses témoins à la fois pendant le travail de préparation à la publication, ainsi que pour et après la publication.

On s'appuiera sur l'édition critique de l'Histoire du Grand Comte Roger par Geoffroi Malaterra, composée en latin vers 1100. L'œuvre est la source littéraire la plus riche en informations sur les membres de la famille de Hauteville et sur les exploits accomplis par chacun d'eux, en particulier par Roger en Sicile. Le texte latin, qui est divisé en quatre livres et rédigé à la fois en prose et en vers, a été établi grâce à la collation exhaustive des manuscrits primaires (A, B – ou Be, copie de B, quand ce dernier fait défaut -, C, Z, conservés dans diverses bibliothèques de Sicile, Besançon et Barcelone), et des deux éditions qui ont marqué son histoire (la princeps de Geronimo Zurita [1578] et celle d'Ernesto Pontieri [1927-28]). Le texte latin est enrichi de trois types de notes : notes d'apparat critique, notes de sources, notes philologiques. Il est accompagné de la traduction française pourvue de notes explicatives, et l'ensemble est indexé (toponymes et anthroponymes). Suite à la redécouverte du manuscrit Z, Gianvito Resta avait montré les manques de l'édition de Pontieri et la nécessité de réaliser à nouveaux frais une édition scientifique[3].

Le travail de recherche pour cette édition, mené en même temps que la découverte des nouveaux outils, nous a incités à choisir le texte de Malaterra comme terrain expérimental pour l'encodage fin des variantes textuelles. En effet, d'une part, l'un des apports essentiels de la recherche sur l'œuvre de Malaterra était d'offrir un nouveau texte scientifiquement édité et pourvu d'un apparat critique complet et justifié ; d'autre part, le nombre de témoins retenus était raisonnable (sept en tout), avec des mains supplémentaires pour les témoins primaires, et les types de variantes textuelles (omissions et lacunes plus ou moins longues, additions, transpositions, substitutions, etc.) étaient suffisamment divers pour tester les différents cas de figure susceptibles d'intervenir dans d'autres travaux d'ecdotique. On a voulu vérifier si l'utilisation du module « Critical Apparatus » de la TEI, en suivant la méthode de la segmentation parallèle, permettait d'encoder les variantes en respectant les recommandations des Belles Lettres et de l'École des Chartes pour l'édition critique de sources et, le cas échéant, quel pouvait en être l'intérêt pour la recherche en ecdotique, mais aussi dans d'autres domaines : paléographie latine, histoire des textes, linguistique latine, historiographie et poésie latines.

Cette méthode permet d'éviter d'avoir à choisir un témoin de base et offre la possibilité d'attribuer à chacun le même statut. Elle permet ensuite d'obtenir une restitution de chacun en plus du texte édité, dans laquelle le lieu variant est marqué par un jeu de couleurs opposant le lemme à la leçon rejetée. Ce travail exige, d'une part, de définir précisément ce qu'il semble intéressant de marquer, ce qu'on cherche à obtenir et, éventuellement, d'opérer des choix, dont certains résultent du tâtonnement de la recherche. D'autre part, ce travail impose rigueur, précision et exhaustivité : tout manque, par exemple, fera croire, sans ambiguïté, à une lacune dans le témoin et toute erreur dans l'association du témoin à sa variante produira une incohérence dans sa restitution. Par ailleurs, tout le travail d'ecdotique sera aisément vérifiable par le lecteur grâce à la publication en ligne des fac-similés. Il s'agit là, sans doute, d'un des aspects à la fois les plus séduisants et les plus terrifiants de l'encodage en TEI de l'apparat critique selon la méthode de la segmentation parallèle : en offrant au lecteur la possibilité de disposer des restitutions de chaque témoin à partir de l'encodage des variantes, il impose une très grande discipline, mais il offre en même temps un formidable outil de relecture, de vérification et de comparaison des témoins.

En procédant ainsi, on a constaté que le module de la TEI donnait la possibilité d'encoder tous les types de variantes, à condition toutefois de renoncer à certaines habitudes des rédacteurs d'apparat critique, en particulier quand elles risquaient de provoquer des enchâssements ou chevauchements incompatibles avec le schéma XML[4]. Cette concession pourrait paraître secondaire, sinon pour une publication papier, du moins pour une publication en ligne, dans laquelle les restitutions des témoins se substitueraient à des notes traditionnelles d'apparat critique ; cependant, il nous semble au contraire que l'apparat critique associé au texte édité doit rester l'outil d'accès privilégié à la compréhension de l'histoire textuelle qu'il a vocation à être et que l'édition numérique peut jouer un rôle dans la redécouverte de cet outil scientifique, qui est bien souvent délaissé dès qu'il est achevé. La méthode appliquée à l'encodage a évolué grâce à la création d'outils de plus en plus sophistiqués au sein de l'environnement dédié. Dans un premier temps, afin d'obtenir un apparat rédigé selon les normes traditionnelles pour la publication papier, on a créé un type de notes « apparat » et rédigé chaque unité critique telle qu'elle doit apparaître sur le papier en plus de l'encodage des variantes en XML TEI (version P5)[5]. Ce choix entraînait une double opération, à la fois chronophage et source d'erreurs d'écriture, si bien qu'il n'était pas sûr que les apports postpublication suffisent à séduire de nouveaux chercheurs. Dès lors, considérant les difficultés et les enjeux, des améliorations ont été apportées par le PDN pour outiller la recherche : le nouvel environnement[6] conçu pour XMLMind XML Editor (version 8.3) permet désormais d'encoder une source ancienne, avec des fonctionnalités génériques et plus performantes, qui réduisent les risques d'erreurs et permettent d'obtenir semi-automatiquement la rédaction de la quasi-totalité des unités critiques. Ainsi, on peut d'autant mieux se concentrer sur le travail critique que le numérique offre de formidables solutions pratiques pour la comparaison des témoins : la vue synoptique des restitutions permet de considérer les variantes dans leur contexte phrastique et non plus de manière extrêmement fragmentée ; elle lève en outre les ambiguïtés que l'apparat critique seul peut parfois laisser par une forme de discours implicite[7]. Grâce à cet environnement de travail – outil d'encodage et prototype de sites –, dont on fera une présentation, l'éditeur dispose d'un nouveau laboratoire de recherche qui modifie de manière conséquente les méthodes de réalisation de son travail et offre de nouvelles perspectives.

Cette communication vise ainsi à encourager les jeunes chercheurs à réaliser des éditions de sources multimodales à partir des outils accessibles et gratuits qui seront présentés, car ils permettent de répondre aux exigences des éditions traditionnelles, tout en améliorant les conditions de la comparaison textuelle ; en outre, ils facilitent l'encodage des données et leur interopérabilité. En effet, considérant la situation dans laquelle se trouvent les humanités classiques, l'utilisation des corpus de sources mis à disposition grâce au numérique restera l'apanage d'une minorité d'érudits, si ceux-ci ne sont pas accompagnés de l'enrichissement scientifique nécessaire à leur compréhension.

Bibliographie complémentaire :

Andrews T., « The Third Way: Philology and Critical Edition in the Digital Age », Variants, 10, 2013, p. 61-76.

Apollon, Régnier, Bélisle (dir.), L'édition critique à l'ère du numérique, Paris, L'Harmattan, 2017 (trad. fr. de Digital Critical Editions, University of Illinois Press, 2014).

Duval F., « Pour des éditions numériques critiques. L'exemple des textes français », Médiévales,73, 2017, p. 13-30.

Bisson Marie, Cannet Edith, Lucas-Avenel Marie-Agnès, Environnement pour réaliser des éditions avec apparat critique en XML TEI P5, documentation du Pôle document numérique, 2020, consultable en ligne : http://www.unicaen.fr/recherche/mrsh/sites/default/files/public/document_numerique/manuel_apparat.pdf

Queste del saint Graal, Christiane Marchello-Nizia & Alexei Lavrentiev (éd.), Lyon, ENS de Lyon, 2019. Publié en ligne par la Base de français médiéval. Dernière révision le 2018-11-30.

Mathieu d'Edesse, Chronique, Tara Andrews (éd.), 2012, consultable en ligne : https://byzantini.st/ChronicleME/.


[1]Pour les éditions de textes latins, l'un des précurseurs a été Bruno Bureau et le projet « Hyperdonat ». Ajoutons aussi l'édition du De natura deorum de Cicéron, PUC, par Clara Auvray-Assayas (https://www.unicaen.fr/puc/sources/ciceron/accueil).

[2]Cet aspect a été dénoncé, par exemple, par E. Pierazzo, « Digital Documentary Editions and the others », Scholarly Editing : The Annual of the Association for Documentary Editing, 2014, 35, p. 1-23 (PDF consultable en ligne).

[3]Resta G. (1964), « Per il testo di Malaterra e di altre cronache meridionali », in Studi per il CL anno del Liceo ginnasio Tomasso Campanella di Reggio Calabria, Reggio de Calabria, De Franco, p. 3-60.

[4]Exemple de transposition qui affecterait hostes (I, 16, 1) : ut timidus hostes devitando. Comment faire en sorte que l'encodage ne marque pas hostes comme lieu variant ?

[5]Ce travail a donné lieu à la publication papier et numérique de Geoffroi Malaterra, Histoire du Grand Comte Roger et de son frère Robert Guiscard, livres I & II, vol. 1,Marie-Agnès Lucas-Avenel (éd.), Caen, Presses universitaires de Caen (Fontes & Paginae), 2016, consultable en ligne : https://www.unicaen.fr/puc/sources/malaterra/accueil.

[6]Cet environnement de travail pour l'édition de sources avec apparat critique en XML et la méthodologie d'encodage sont consultables et téléchargeables en ligne : http://www.unicaen.fr/recherche/mrsh/document_numerique/outils/apparat.

[7]Cette nouvelle méthode a été utilisée pour l'édition critique multimodale des livres III et IV, dont l'ensemble a constitué l'inédit de l'HDR, « Éditer des œuvres latines à l'ère du numérique. Édition critique multisupport de Geoffroi Malaterra, Histoire du grand comte Roger et de son frère Robert Guiscard(Livres III & IV) » (garant C. Jacquemard), 6 décembre 2019, Université de Caen Normandie.


Personnes connectées : 2 Vie privée
Chargement...