exit

Information et communication   > Accueil   > Recherche d’information, document et web sémantique   > Numéro 1   > Article

DataNews : Contextualisation de valeurs chiffrées dans des dépêches

DataNews: contextualisation of quantified values in wires


Chloé Monnin
Syllabs

Olivier Hamon
Syllabs

Victor Schmitt
WeDoData

Brice Terdjman
WeDoData



Publié le 20 janvier 2020   DOI : 10.21494/ISTE.OP.2020.0464

Résumé

Abstract

Mots-clés

Keywords

L’Open Data fournit de nombreuses données publiques avec une couverture très large, mais aucune base n’a jamais été structurée à partir d’informations issues de l’actualité. À travers DataNews, notre objectif est d’aller chercher automatiquement des données afin d’offrir un moyen de les réutiliser. Pour ce faire, nous avons tout d’abord défini une typologie d’événements dans le contexte spécifique des décès dans des dépêches AFP. Puis, en se limitant aux catastrophes naturelles, nous avons regroupé ces dépêches par événement afin de pouvoir les identifier. La dernière étape a pour objectif de construire des patrons d’extraction afin de collecter les valeurs correspondant au nombre de morts, de même que le contexte associé à ces valeurs. Les résultats de nos évaluations nous ont confirmé le fort potentiel de notre méthode qui pourrait amener à l’élaboration de plusieurs applications.

The Open Data allows the access to plentiful data, with a large coverage, but none of them offers a structured databased around news. Through DataNews, our goal is to seek for data automatically so as to provide means to reuse them. To do so, we first defined an event typology in the specific context of death in AFP wires. Then, by restraining ourselves to the natural disasters, we clustered these wires by events so as to identify them. The goal of the last step is to build extraction patterns so as to collect values corresponding to the death number, as well as the context associated to these values. The results of our evaluations reassured ourselves in the large potential of our method that could lead to several applications.

base de connaissances extraction d’information construction de patrons détection d’événements

knowledge base information extraction pattern building event detection