Information and Communication > Home > Information Retrieval, Document and Semantic Web > Issue 1 > Article
Adrien Bougouin
LS2N - Université de Nantes
Florian Boudin
LS2N - Université de Nantes
Béatrice Daille
LS2N - Université de Nantes
Published on 9 January 2018 DOI : 10.21494/ISTE.OP.2018.0210
This article presents the participation of the TALN group at LINA to the défi fouille de textes (DEFT) 2016. Developed
specifically for automatic keyphrase annotation, we propose a new method, TopicCoRank, extracting the most important phrases from a
document and providing key-phrases that do not occur in the document. Our system ranked third out of a total of five systems.
Cet article présente la participation de l’équipe TALN du LINA au défi fouille de textes (DEFT) 2016. Pour la tâche d’indexation
de documents de domaines de spécialité par l’intermédiaire de leurs mots-clés, nous avons proposé une méthode à base de
graphe, TopicCoRank, dans la lignée des approches à base de graphes proposées en recherche d’information. TopicCoRank modélise
les informations présentes dans le document et la connaissance du domaine pour réaliser une indexation plus exhaustive et respectueuse
du vocabulaire du domaine. Notre système s’est classé à la troisième place quel que soit le domaine de spécialité.
DEFT 2016 keyphrase extraction keyphrase assignment graph-based method specific domain
DEFT 2016 extraction de mots-clés assignation de mots-clés méthode à base de graphe domaine de spécialité