@ARTICLE{10.21494/ISTE.OP.2025.1303, TITLE={Analyse multidimensionnelle de contenus des réseaux sociaux : stratégies, calcul et visualisation d’indicateurs pour le tourisme}, AUTHOR={Maxime Masson , Rodrigo Agerri , Christian Sallaberry , Marie-Noelle Bessagnet , Philippe Roose , Annig Le Parc Lacayrelle, }, JOURNAL={Revue ouverte d’ingénierie des systèmes d’information}, VOLUME={5}, NUMBER={Numéro Spécial}, YEAR={2025}, URL={https://openscience.fr/Analyse-multidimensionnelle-de-contenus-des-reseaux-sociaux-strategies-calcul}, DOI={10.21494/ISTE.OP.2025.1303}, ISSN={2634-1468}, ABSTRACT={L’influence grandissante des réseaux sociaux dans le domaine du tourisme souligne le besoin d’approches efficaces en traitement automatique du langage naturel (TALN) pour exploiter cette ressource. Toutefois, transformer des textes multilingues, informels et non structurés en connaissances structurées reste un défi, notamment à cause de la nécessité de données annotées pour l’entraînement des modèles. Cet article examine, dans un premier temps, différents techniques et modèles de TALN basés sur l’apprentissage pour optimiser les performances tout en réduisant le besoin de données annotées manuellement. Un nouveau jeu de données multilingues (français, anglais, espagnol) spécifique au tourisme a été créé, se concentrant sur la région du Pays Basque. Ce jeu de données inclut des tweets avec des annotations manuelles sur les entités nommées spatiales, les concepts thématiques touristiques et les sentiments. Une comparaison des méthodes de fine-tuning et d’apprentissage few-shot avec des modèles multilingues indique que les techniques few-shot peuvent produire de bons résultats avec peu d’exemples annotés. Les expérimentations menées sur ce jeu de données suggèrent la possibilité d’appliquer les méthodes de TALN à base d’apprentissage à divers domaines, tout en réduisant le besoin d’annotations manuelles et évitant les complexités des méthodes basées sur des règles. Dans un second temps, nous présentons TextBI, un tableau de bord générique multimodal conçu pour présenter des analyses d’annotations textuelles multidimensionnelles sur de grands volumes de données de médias sociaux multilingues. Cet outil se concentre sur plusieurs dimensions : spatiale, temporelle, thématique et personnelle, et prend également en charge des données d’enrichissement supplémentaires telles que le sentiment et l’engagement. Notre approche, TextBI, représente une avancée significative dans le domaine de la visualisation de résultats d’annotations TALN en intégrant et en mélangeant les caractéristiques d’une variété d’outils de Business Intelligence, de systèmes d’information géographique et de TALN.}}