TY - Type of reference TI - Représentation vectorielle de documents pour l’indexation de notices bibliographiques AU - Morgane Marchand AU - Geoffroy Fouquier AU - Emmanuel Marchand AU - Guillaume Pitel AB - Cet article présente la contribution d’eXenSa à l’édition 2016 du DÉfi Fouille de Textes (DEFT) dont la tâche consiste à indexer des documents scientifiques par des mots-clefs, préalablement sélectionnés par des professionnels. Le système proposé est purement statistique et combine une approche graphique et une approche sémantique. La première approche cherche dans le titre et le résumé du document des mots graphiquement proches des mots-clefs du thésaurus. La seconde approche attribue à un nouveau document des mots-clefs associés aux documents du corpus d’entraînement qui lui sont sémantiquement proches. Les deux approches utilisent des représentations vectorielles apprises en utilisant l’algorithme NC-ISC, un algorithme stochastique de factorisation de matrices. Notre approche a été classée première en terme de F-mesure sur deux des corpus de spécialité proposés et deuxième sur les deux autres. DO - 10.21494/ISTE.OP.2018.0208 JF - Recherche d’information, document et web sémantique KW - Indexation, mots-clefs, espaces sémantiques, représentation vectorielle de mots, Indexation, keywords, semantic spaces, word vector embedding, L1 - https://openscience.fr/IMG/pdf/iste_ridows17v1n4.pdf LA - fr PB - ISTE OpenScience DA - 2018/01/9 SN - 2516-3280 TT - Document vector embeddings for bibliographic records indexing UR - https://openscience.fr/Representation-vectorielle-de-documents-pour-l-indexation-de-notices IS - Numéro 1 VL - 1 ER -