exit

Ingénierie et systèmes   > Accueil   > Ingénierie cognitique   > Numéro 1   > Article

Classification de variables et analyse multivariée de données mixtes issues d’une étude BCI

Clustering of variables and multivariate analysis of mixed data from BCI study


Jérôme Saracco
ENSC - Bordeaux INP

Marie Chavent
Université de Bordeaux

Liliana Audin-Garcia
ENSC - Bordeaux INP

Véronique Lespinet-Najib
ENSC - Bordeaux INP

Ricardo Ron-Angevin
Universidad de Málaga
Espagne



Publié le 18 décembre 2018   DOI : 10.21494/ISTE.OP.2018.0311

Résumé

Abstract

Mots-clés

Keywords

L’objectif de ce travail est de traiter des données complexes issues de la technique des Brain Computer Interfaces (BCI) au moyen de méthodes statistiques multivariées (approche PCAmix et classification de variables) afin de mieux comprendre et interpréter les relations qui existent entre elles. Cet article présente ainsi la classification de variables qui a pour but de réunir des variables fortement liées entre elles. L’approche proposée fonctionne avec des données mixtes, c’est à dire des données contenant des variables numériques et des variables catégorielles. Deux algorithmes de classification de variables sont décrits : un de classification hiérarchique et un autre de partitionnement de type k-means. Une rapide description de la méthode PCAmix (qui permet de faire de l’analyse en composantes principales pour des données mixtes) est fournie, vu que le calcul des variables synthétiques résumant les classes de variables obtenues est fondé sur cette méthode multivariée. Enfin, les approches PCAmix et ClustOfVar (implémentées dans les packages R ClustOfVar et PCAmixdata) sont mises en oeuvre sur les données réelles issues de l’étude BCI. Des recommandations, reposant non seulement sur des critères de performances, d’efficience mais aussi de satisfaction, ont pu être faites concernant le choix d’interface dans l’usage des claviers virtuels, notamment pour des personnes avec des problèmes moteurs tels que la maladie de Charcot.

The aim of this work is to analyze complex data from a Brain Computer Interfaces (BCI) study using multivariate statistical methods (PCAmix approach and clustering of variables) to better understand and interpret their relationships. This article presents clustering of variables which aim is to lump together strongly related variables. The proposed approach works on a mixed data set, i.e. on a data set which contains numerical variables and categorical variables. Two algorithms of clustering of variables are described : a hierarchical clustering and a k-means type clustering. A brief description of PCAmix method (that is a principal component analysis for mixed data) is provided, since the calculus of the synthetic variables summarizing the obtained clusters of variables is based on this multivariate method. Finally, the PCAmix and ClustOfVar approaches (implemented in the R packages ClustOfVar and PCAmixdata) are illustrated on a real dataset from a BCI (brain computer interface) study. Recommendations, based not only on performance, efficiency, but also on satisfaction criteria, could be made concerning the choice of interface in the use of virtual keyboards, especially for people with motor disorder such as Charcot’s disease.

Classification de variables données mixtes analyse en composantes principales packages R brain computer interface analyse multivariée des données visualisation des données

clustering of variables mixed data principal component analysis for mixed data R packages brain computer interface multivariate data analysis data visualization