Présentation

Nombre de projets incluent aujourd’hui une étape d’acquisition automatique du texte dans leur chaîne de production ou d’exploitation des données. Plusieurs plateformes de transcription et différents moteurs HTR sont maintenant disponibles. L’intégration de cette technologie dans des chaînes de traitement de plus en plus efficaces a entraîné une automatisation des tâches qui remet en question la place du chercheur dans le processus d’établissement du texte. Cette nouvelle pratique, gourmande en données, rend pressant le besoin de rassembler, et donc d’harmoniser les corpus nécessaires à la constitution de corpus d’entraînement, mais aussi leur mise à disposition pour améliorer la qualité des résultats de l’HTR. 

Ce colloque est organisé dans le cadre du projet CREMMALAB soutenu par le DIM MAP, l’École nationale des chartes - PSL (Centre Jean-Mabillon), en partenariat avec le LAMOP et le LabEX Hastec.

Consulter le programme

Partager sur les réseaux sociaux