La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées

Revue : The Programming Historian en français

Consulter la fiche HAL

Résumé

Ce tutoriel a pour but de décrire les bonnes pratiques pour la création d'ensembles de données et la spécialisation des modèles en fonction d'un projet HTR (*Handwritten Text Recognition*) ou OCR (*Optical Character Recognition*) sur des documents qui n'utilisent pas l'alphabet latin et donc pour lesquels il n'existe pas ou très peu de données d'entraînement déjà disponibles. Le tutoriel a ainsi pour but de montrer des approches de *minimal computing* (ou d'investissement technique minimal) pour l'analyse de collections numériques à grande échelle pour des langues peu dotées. Notre tutoriel se concentrera sur un exemple en grec ancien, puis proposera une ouverture sur le traitement d'écritures arabes maghrébines manuscrites.

Partager sur les réseaux sociaux

Publications de chercheur

Voir la liste complète

Publication de chercheur

CATMuS-Medieval: Consistent Approaches to Transcribing ManuScripts

Communication dans un congrès
- Ariane Pinche,
  Thibault Clérice,
  Jean-Baptiste Camps,
  Malamatenia Vlachou-Efstathiou,
  Matthias Gille Levenson,
  Olivier Brisville-Fertin,
  Federico Boschetti,
  Franz Fischer,
  Michael Gervers,
  Agnès Boutreux,
  Avery Manton,
  Simon Gabay,
  Wouter Haverals,
  Mike Kestemont,
  Caroline Vandyck,
  Patricia O'Connor,
  Alix Chagué
- Date de parution : 2024
Publication de chercheur

Layout Analysis Dataset with SegmOnto

Communication dans un congrès
- Thibault Clérice,
  Juliette Janes,
  Hugo Scheithauer,
  Sarah Bénière,
  Laurent Romary,
  Benoît Sagot
- Date de parution : 2024
Publication de chercheur

Detecting Sexual Content at the Sentence Level in First Millennium Latin Texts

Communication dans un congrès Nouveau
- Thibault Clérice
- Date de parution : 2024

Publications aux éditions de l’École

Voir la liste complète

Publication de l'École

La véridique histoire de l’arobase
- Marc H. Smith
Publication de l'École

L’Ordinaire mestre Tancré
- Frédéric Duval
Publication de l'École

Le malheur d’être femme
- Pascale Bourgain
Publication de l'École

Abécédaire insolite du livre ancien
- Christine Bénévent
Publication de l'École

La bibliothèque de Thou et ses catalogues
- Valérie Neveu
Publication de l'École

Positions des thèses 2023
- Promotion 2023
Publication de l'École

Des archives considérées comme une substance hallucinogène
- Michel Melot
Publication de l'École

L’historien face à l’animal
- Michel Pastoureau
Voir la liste complète

Sur les mêmes thématiques

Voir la liste complète

Applications, éditions et jeux de données

Voir la liste complète

Applications, éditions et jeux de données

DicoTopo

Production
- Porté par le CJM
Applications, éditions et jeux de données

Elec

Production, dev, bêta
- Édition de texte
- Porté par le CJM
Applications, éditions et jeux de données

Adele

Production
- Édition de texte,
  Images
- Porté par le CJM

La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées

Résumé

Partager sur les réseaux sociaux

Publications de chercheur

CATMuS-Medieval: Consistent Approaches to Transcribing ManuScripts

Layout Analysis Dataset with SegmOnto

Detecting Sexual Content at the Sentence Level in First Millennium Latin Texts

Publications aux éditions de l’École

La véridique histoire de l’arobase

L’Ordinaire mestre Tancré

Le malheur d’être femme

Abécédaire insolite du livre ancien

La bibliothèque de Thou et ses catalogues

Positions des thèses 2023

Des archives considérées comme une substance hallucinogène

L’historien face à l’animal

Sur les mêmes thématiques

Représenter l'Algérie. Images et conquête au XIX^e siècle

Roi-Soleil et Dieu. Essai sur la religion de Louis XIV

Une « dissimulation profonde » : l’insondable duc de Marlborough

Où va l’État « à la française » ?

Applications, éditions et jeux de données

DicoTopo

Elec

Adele

La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées

Résumé

Partager sur les réseaux sociaux

Publications de chercheur

CATMuS-Medieval: Consistent Approaches to Transcribing ManuScripts

Layout Analysis Dataset with SegmOnto

Detecting Sexual Content at the Sentence Level in First Millennium Latin Texts

Publications aux éditions de l’École

La véridique histoire de l’arobase

L’Ordinaire mestre Tancré

Le malheur d’être femme

Abécédaire insolite du livre ancien

La bibliothèque de Thou et ses catalogues

Positions des thèses 2023

Des archives considérées comme une substance hallucinogène

L’historien face à l’animal

Sur les mêmes thématiques

Représenter l'Algérie. Images et conquête au XIXe siècle

Roi-Soleil et Dieu. Essai sur la religion de Louis XIV

Une « dissimulation profonde » : l’insondable duc de Marlborough

Où va l’État « à la française » ?

Applications, éditions et jeux de données

DicoTopo

Elec

Adele

Représenter l'Algérie. Images et conquête au XIX^e siècle