• Congrès : JADT2022: 16th International Conference on Statistical Analysis of Textual Data (2022-07-06 - 2022-07-08)
  • Directeur(s) : Univ. of Naples Federico II
  • Éditeur : Edizioni Erranti
  • Pages : 712-720

Résumé

Brevets d’invention et articles scientifiques représentent une source essentielle pour mesurer la production scientifique et technologique, servant de base aux analyses scientométriques les plus variées. Les noms d’auteurs et d’inventeurs constituent un identifiant pivot pour réaliser ces analyses, mais ils nécessitent d’être désambiguïsés. Par extension l’identification des inventeurs qui sont également des auteurs académiques est un problème non trivial. Nous proposons une méthode utilisant la classification internationale des brevets et l’API IPCCAT pour évaluer le degré de similarité entre le résumé du brevet d’un inventeur donné et ceux des articles de personnes homonymes, afin d’apparier des deux types de documents. La méthode est développée et qualifiée manuellement sur trois corpus de brevets issus de la base internationale Espacenet de l’OEB. Sur un jeu de 4679 brevets et 7720 inventeurs, nous obtenons un résultat de 2501 auteurs. L’algorithme proposé résout le problème général de la levée d’homonymie avec un taux d’erreur inférieur à 5%.

Partager sur les réseaux sociaux

Publications de chercheur

Publications aux éditions de l’École

Sur les mêmes thématiques

Applications, éditions et jeux de données