Du 5 au 9 janvier, le master « Humanités numériques » a organisé une semaine de hackathons et de compétitions réunissant les étudiants de M1 et M2, ainsi que quelques anciens. L’événement visait à exploiter des corpus issus des humanités et des SHS proposés par des institutions, des entreprises et des chercheurs, en mobilisant et comparant différentes méthodes de visualisation, d’apprentissage automatique et de traitement par l’IA enseignées dans le cadre du master.

Les projets ont couvert un large éventail de thématiques : transmission de manuscrits, fonds photographiques, pétroarchéologie, archives audiovisuelles de la télévision française, au milieu de bien d’autres.

Liste des projets retenus

Environ 50 participants (33 étudiants, anciens et porteurs de projets) ont travaillé quotidiennement dans un format intensif (9h–20h) à la découverte, l’implémentation et la combinaison de méthodes en vision par ordinateur, visualisation, extraction de métadonnées et traitement automatique des langues. La majorité des projets ont abouti à des solutions fonctionnelles, tout en explorant de nombreuses pistes méthodologiques et benchmarks. Les présentations publiques des projets et des résultats ont réuni pour leur part environ 70 personnes à chaque fois.

Parmi les approches mobilisées durant la semaine, on peut citer des embeddings et OCR de Mistral pour l’extraction de métadonnées dans un corpus de professions de foi aux dernières legislatives, YOLO pour la classification de fonds photographiques et la détection d’arbres stemmatologiques dans des corpus philologiques, GLINER pour la détection d’entitées architecturales dans des corpus épigraphiques latins, de la transcription vocale par des modèles ASR de NVIDIA et identification de speaker, de l’extraction textuelle et génération de données par VLM, Grounding-DINO et SAM sur des enluminures médiévales, géolocalisation de monuments dans des corpus de cartes postales, et bien d’autres[1].

Dépôt Github de l’École avec les codes, équipes et résultats obtenus

Cette semaine s’inscrit pleinement dans la maquette pédagogique du master, comme une formation à la recherche par la pratique. 

Félicitations à l’ensemble des équipes pour leur engagement et leurs résultats, ainsi pour leur bonne humeur tout au long de la semaine, et merci aux institutions partenaires pour les projets proposés et leur accompagnement.

L’événement a bénéficié du soutien de l’ERC LostMa, de l’ANR via la chaire de professeur junior de l’École nationale des chartes - PSL, de la junior-entreprise CartaData, ainsi que des services de logistique, de la direction des études et de la direction de la recherche.

Intervenant(s)

    Note(s) :
  • [1]

    Les questions de biais et de limites des approches computationnelles ont été abordées de manière exploratoire et devront faire l’objet d’un approfondissement ultérieur.

Partager sur les réseaux sociaux

Actualités