@ARTICLE{10.21494/ISTE.OP.2021.0606, TITLE={Évolution et formalisation de la Lambda Architecture pour des analyses à hautes performances - Application aux données de Twitter}, AUTHOR={Annabelle Gillet, Éric Leclercq, Nadine Cullot, }, JOURNAL={Revue ouverte d’ingénierie des systèmes d’information}, VOLUME={2}, NUMBER={Numéro 1}, YEAR={2021}, URL={https://openscience.fr/Evolution-et-formalisation-de-la-Lambda-Architecture-pour-des-analyses-a-hautes}, DOI={10.21494/ISTE.OP.2021.0606}, ISSN={2634-1468}, ABSTRACT={Extraire de la valeur des données des réseaux sociaux est une tâche complexe induite par leur vélocité, volume et variabilité. Les utilisateurs s’approprient le dispositif et développent des usages multiples, ce qui renforce la variabilité sémantique. Les résultats des analyses doivent être produits au plus tôt (de manière optimale en temps réel) pour en renforcer la pertinence. Pour y parvenir, des connaissances métiers sont essentielles et elle sont généralement acquises lors d’analyses exploratoires. En conséquence, les plateformes de collecte, stockage et analyse des données des réseaux sociaux doivent supporter des flux de données importants, des analyses en temps réel et des analyses exploratoires. Des styles et des patrons d’architecture permettent de prendre en compte ces spécificités, afin de proposer des techniques de prise en charge de ces données, et ainsi de faciliter leur traitement. Ces architectures ont besoin d’être formalisées, pour étudier de quelle manière les propriétés essentielles sont respectées, connaître leur comportement, et anticiper les effets que peuvent avoir les composants lorsqu’ils sont regroupés au sein d’une même architecture, et ce avant même de les développer puis de les mettre en production. Dans cet article, nous proposons un patron d’architecture, la Lambda+ Architecture, inspiré de la Lambda Architecture et adapté au traitement des données massives. Nous proposons également un cadre formel pour la spécification d’architectures se basant sur la théorie des catégories, ainsi qu’une implémentation de notre patron pour analyser les données issues de Twitter.}}