Information et communication > Accueil > Recherche d’information, document et web sémantique > Numéro 1 > Article
Adrien Bougouin
LS2N - Université de Nantes
Florian Boudin
LS2N - Université de Nantes
Béatrice Daille
LS2N - Université de Nantes
Publié le 9 janvier 2018 DOI : 10.21494/ISTE.OP.2018.0210
Cet article présente la participation de l’équipe TALN du LINA au défi fouille de textes (DEFT) 2016. Pour la tâche d’indexation
de documents de domaines de spécialité par l’intermédiaire de leurs mots-clés, nous avons proposé une méthode à base de
graphe, TopicCoRank, dans la lignée des approches à base de graphes proposées en recherche d’information. TopicCoRank modélise
les informations présentes dans le document et la connaissance du domaine pour réaliser une indexation plus exhaustive et respectueuse
du vocabulaire du domaine. Notre système s’est classé à la troisième place quel que soit le domaine de spécialité.
This article presents the participation of the TALN group at LINA to the défi fouille de textes (DEFT) 2016. Developed
specifically for automatic keyphrase annotation, we propose a new method, TopicCoRank, extracting the most important phrases from a
document and providing key-phrases that do not occur in the document. Our system ranked third out of a total of five systems.
DEFT 2016 extraction de mots-clés assignation de mots-clés méthode à base de graphe domaine de spécialité
DEFT 2016 keyphrase extraction keyphrase assignment graph-based method specific domain