CremmaLab projects

L’étape d’acquisition du texte est première dans la plupart de nos entreprises de recherche, qu’il s’agisse d’édition de texte, d’études linguistiques, philologiques et historiques, ou de traitement massif de corpus. Pour produire des corpus textuels de qualité, il est crucial de pouvoir partager librement, en en garantissant l’interopérabilité, les données que nous produisons, et, in fine, de proposer à la communauté scientifique des modèles réutilisables. Pour répondre à ces besoins, et plus spécifiquement aux besoins des médiévistes, le projet CREMMALAB propose des réflexions méthodologiques sur les protocoles de transcriptions des corpus afin d’optimiser des modèles d’HTR à travers la rédaction d’un guide de transcription et la mise à disposition de modèles d’HTR. Nous présenterons les premiers résultats de ces travaux à travers le traitement de deux corpus massifs : un corpus de romans de chevalerie et un corpus de textes hagiographiques, pris en diachronie (xiii^e‑xv^e siècle).

Partager sur les réseaux sociaux

À découvrir

Découvrez d'autres productions de l'École sur les mêmes thématiques.

Humanités numériques

Consulter la page «Humanités numériques»

Computational Museology in the Age of Experience

Vidéo
- Sarah Kenderdine
Whose Pen Wrote the Map? Battling Over the Armenian Medieval Text Ashkharhatsuyts with Stylometry

Publication de chercheur
- Jean-Baptiste Camps,
  Chahan Vidal-Gorène
From questions to insights: a reproducible question-answering pipeline for historiographical corpus exploration

Publication de chercheur
- Lucas Terriel,
  Vincent Jolivet
A Riddle in a Haystack: LLM Detection of Intricate Wordplays in Colette and Willy's Novels for Authorship Attribution

Publication de chercheur
- Florian Cafiero,
  Marie Puren
Greening your database of literary works: How to avoid reinventing vocabularies, in favor of sustainable, reusable models

Publication de chercheur
- Kelly Christensen,
  Jean-Baptiste Camps
Évaluation automatique du retour à la source dans un contexte historique long et bruité : les débats parlementaires de la Troisième République française

Publication de chercheur
- Aurélien Pellet,
  Julien Perez,
  Marie Puren
Style in Eight Syllables: Metric Annotation and Stylometry of Chrétien de Troyes and Contemporaries

Publication de chercheur
- Jean-Baptiste Camps,
  Florian Cafiero,
  Philippe Chaumet-Riffaud,
  Damien Conceicao,
  Ulysse Godreau,
  Émilie Guidi,
  Théo Moins,
  Pierre-Alexandre Nistor,
  Benedetta Salvati,
  Alexandre Lionnet-Rollin
The times are a-changin': présent vs passé simple in French novels (1811-2024)

Publication de chercheur
- Simon Gabay,
  Jean Barré,
  Florian Cafiero
Consulter la page «Humanités numériques»

Informatique et ingénierie documentaire

Consulter la page «Informatique et ingénierie documentaire»

Nous suivre

CremmaLab projects

Résumé

Partager sur les réseaux sociaux

À découvrir

Humanités numériques

Computational Museology in the Age of Experience

Whose Pen Wrote the Map? Battling Over the Armenian Medieval Text Ashkharhatsuyts with Stylometry

From questions to insights: a reproducible question-answering pipeline for historiographical corpus exploration

A Riddle in a Haystack: LLM Detection of Intricate Wordplays in Colette and Willy's Novels for Authorship Attribution

Greening your database of literary works: How to avoid reinventing vocabularies, in favor of sustainable, reusable models

Évaluation automatique du retour à la source dans un contexte historique long et bruité : les débats parlementaires de la Troisième République française

Style in Eight Syllables: Metric Annotation and Stylometry of Chrétien de Troyes and Contemporaries

The times are a-changin': présent vs passé simple in French novels (1811-2024)

Informatique et ingénierie documentaire

e-NDP. Notre-Dame de Paris et son cloître

Les archives inquisitoriales (Portugal) sous HTR : le projet TraPrInq

Utilisation comparée de plusieurs dispositifs de transcription numérique d’archives de fouilles archéologiques

Exemples d’application des technologies de l’intelligence artificielle dans le domaine de l’image

Principes de l’apprentissage de réseaux de neurones pour la description des images

Historique de l’irruption de l’intelligence artificielle dans le domaine de l’image

Modéliser l’indexation par intelligence artificielle, l’exemple de Picture Meaning

Les défis des bases de données iconographiques aujourd’hui