Information and Communication > Home > Information Retrieval, Document and Semantic Web > Issue 1 > Article
Chloé Monnin
Syllabs
Olivier Hamon
Syllabs
Victor Schmitt
WeDoData
Brice Terdjman
WeDoData
Published on 20 January 2020 DOI : 10.21494/ISTE.OP.2020.0464
The Open Data allows the access to plentiful data, with a large coverage, but none of them offers a structured databased around news. Through DataNews, our goal is to seek for data automatically so as to provide means to reuse them. To do so, we first defined an event typology in the specific context of death in AFP wires. Then, by restraining ourselves to the natural disasters, we clustered these wires by events so as to identify them. The goal of the last step is to build extraction patterns so as to collect values corresponding to the death number, as well as the context associated to these values. The results of our evaluations reassured ourselves in the large potential of our method that could lead to several applications.
L’Open Data fournit de nombreuses données publiques avec une couverture très large, mais aucune base n’a jamais été structurée à partir d’informations issues de l’actualité. À travers DataNews, notre objectif est d’aller chercher automatiquement des données afin d’offrir un moyen de les réutiliser. Pour ce faire, nous avons tout d’abord défini une typologie d’événements dans le contexte spécifique des décès dans des dépêches AFP. Puis, en se limitant aux catastrophes naturelles, nous avons regroupé ces dépêches par événement afin de pouvoir les identifier. La dernière étape a pour objectif de construire des patrons d’extraction afin de collecter les valeurs correspondant au nombre de morts, de même que le contexte associé à ces valeurs. Les résultats de nos évaluations nous ont confirmé le fort potentiel de notre méthode qui pourrait amener à l’élaboration de plusieurs applications.
knowledge base information extraction pattern building event detection
base de connaissances extraction d’information construction de patrons détection d’événements