Les hypothèses de Paul Meyer à la lumière de l’analyse computationnelle

Présentation

L’étude stylométrique des textes médiévaux en langue vernaculaire reste encore aujourd’hui un défi de taille en raison de l’impact des variations liées aux copistes, aux graphies, ou encore à la tradition manuscrite qui peuvent introduire variantes et erreurs textuelles au fil du temps et des copies successives. Si, comme nous le proposons, ici, avec l’étude du manuscrit français 412 de la BnF, baser notre étude sur une copie d’une main unique permet de limiter une partie de ces phénomènes de variations1, l’impossibilité de se procurer une transcription diplomatique ou une édition du manuscrit complet nous a forcés à nous fonder sur les transcriptions du manuscrit générées automatiquement, rendant l’analyse relativement complexe en raison du bruit présent dans les données de départ.

Dans le cadre de cette étude, nous avons donc mis en place une chaîne de production et d’analyse des données qui part de la reconnaissance automatique de l’écriture du manuscrit fr. 412 en passant par des traitements successifs de normalisation pour aboutir à l’analyse stylométrique des données ainsi produites afin de proposer une évaluation des hypothèses de Paul Meyer sur le processus de composition des légendiers, mais aussi pour détecter, si possible, des groupements de la plume du même auteur au sein de ce vaste ensemble de Vies anonymes.

Note

Camps, J.-B., & Cafiero, F. (2012). Setting bounds in a homogeneous corpus: a methodological study applied to medieval literature. Revue Des Nouvelles Technologies de l’Information, SHS-1 (MASHS 2011/2012. Modèles et Apprentissages en Sciences Humaines et Sociales Rédacteurs invités : Mar), 55-84.

Partager sur les réseaux sociaux

Sur les mêmes thématiques

Applications, éditions et jeux de données