• Congrès : Lift2-2025 : Journées scientifiques du réseau thématique LIFT2 - linguistique informatique, formelle et de terrain (2025)

Résumé

Cet article évalue trois tâches de TAL (lemmatisation, étiquetage morphosyntaxique, analyse morphologique) sur quatre variétés de l'arménien : arménien classique, oriental moderne, occidental moderne et le dialecte de Getashen. Trois familles de modèles sont comparées : réseaux récurrents (RNN), transformer multilingue (mDeBERTa) et modèle génératif (GPT-4-Turbo-2024-04-09). Les RNNs excellent en supervision complète, mDeBERTa modélise efficacement la morphologie, tandis que GPT-4-Turbo surpasse les autres en transfert zéroet few-shot vers Getashen. Ces résultats soulignent l'efficacité de l'apprentissage in-context pour le TAL des langues peu dotées et des variétés dialectales.

    Partager sur les réseaux sociaux