Le master « Humanités numériques » organise du 5 au 9 janvier 2026 une semaine de hackathons et compétitions en IA et sciences des données pour les SHS, à laquelle prendront part les étudiants du master (environ 35 étudiants). Nous invitons laboratoires, porteurs de projets de recherche, entreprises et institutions à proposer des jeux de données et des tâches associées afin que les étudiants puissent développer, comparer et proposer des solutions à des problématiques de recherche concrètes.
Ce que nous recherchons
Chaque défi proposé devra inclure :
un jeu de données (ou accès à des données, les corpus en open access seront privilégiés),
une ou plusieurs tâches calibrées sur une semaine (ex. classification, annotation, scrapping, extraction d’information, visualisation, modélisation prédictive),
une baseline de résultat à dépasser (dans le cas d’une compétition),
une présentation introductive de 15/20 minutes (du corpus et des objectifs),
éventuellement un mentor pour suivre un ou plusieurs groupes sur la semaine,
si possible un prix pour récompenser l’équipe gagnante.
Exemples de corpus et thématiques (non exhaustif)
Les données mobilisées peuvent être très variées et refléter la richesse des SHS :
Corpus textuels : presse historique, débats parlementaires, littérature numérisée, archives et manuscrits, blogs, réseaux sociaux (ex. Twitter, YouTube).
Corpus visuels et multimédias : images patrimoniales, iconographie, cartes anciennes, vidéos YouTube, bases iconographiques en art et archéologie.
Corpus spécialisés : bases prosopographiques, données linguistiques, corpus annotés en entités nommées, données épigraphiques ou paléographiques.
Corpus contemporains : discours politiques, campagnes de désinformation sur les réseaux sociaux, études sur le climat et les controverses scientifiques, blogs de fan fictions, etc.
Ces thématiques prolongent les recherches déjà menées par les étudiants (voir le blog des étudiants du master Humanodon) : stylométrie, analyse de discours politiques, détection de la désinformation, analyse de réseaux sociaux, fouille de corpus littéraires et historiques.
Exemples de tâches possibles (non exhaustif)
TAL : authentification d’un style d’écriture, attribution d’auteur, modélisation de discours politiques, détection de réemplois textuels, identification d’un motif textuel, etc.
Vision par ordinateur : similarité entre enluminures, reconnaissance de motifs iconographiques, alignement de cartes anciennes et modernes, amélioration d’OCR sur manuscrits, etc.
Annotation : repérage d’entités nommées dans des corpus historiques, catégorisation d’images patrimoniales, annotation des émotions ou des relations sémantiques dans des débats.
Format et ouverture
Les étudiants travailleront en équipes pour développer des solutions, benchmarker les approches ou produire des jeux de données annotés.
La semaine est ouverte à d’autres masters ou groupes d’étudiants, afin de favoriser une dynamique interdisciplinaire et compétitive.
Profils des étudiants participants
Le master forme chaque année environ 35 étudiants (M1 et M2). Leur formation articule sciences des données, informatique et SHS computationnelles :
Programmation et outils : Python par la pratique, XML/TEI, bash, git.
Data science & IA : méthodes quantitatives, apprentissage automatique, LLM, traitement automatique du langage, analyse de réseaux, vision par ordinateur.
SHS computationnelles : philologie, analyse de corpus textuels, fouille de données patrimoniales, visualisation interactive, humanités spatialisées, paléographie et image.
Pratique de la recherche : mini-mémoires dès le M1, stages en laboratoire, séminaires de recherche thématiques, soutenances de mémoires en M2.
Ces étudiants ont donc une double compétence : capacité à manipuler et modéliser des données complexes, tout en intégrant une approche critique et disciplinaire propre aux sciences humaines.
Esprit de l’événement
Cet événement ne constitue en aucun cas une prestation de sous-traitance. Les travaux réalisés par les étudiants sont menés dans un cadre pédagogique et exploratoire, sans garantie de qualité ou de livrable exploitable.
À l’issue de la semaine, les équipes fourniront un compte rendu de leurs travaux, mais il est possible que ceux-ci ne débouchent sur aucun résultat concret.
Il s’agit d’un travail de recherche de bonne foi entre toutes les parties.
Pour des prestations encadrées et contractualisées, merci de vous adresser à l’association CartaData, qui propose des prestations d’exploitation et de conseil en données patrimoniales.
Modalités pratiques
Dates de l’événement : 5-9 janvier 2026
Date limite de soumission des propositions : 15 novembre 2025
Notification d’acceptation : 30 novembre 2025
Lieu : École nationale des chartes - PSL, 65 rue de Richelieu, Paris 2e
Contact
Chahan Vidal-Gorène, responsable du master « Humanités numériques » : chahan.vidal-gorene@chartes.psl.eu








