exit

Engineering and Systems   > Home   > Cognitive Engineering   > Issue 1   > Article

Clustering of variables and multivariate analysis of mixed data from BCI study

Classification de variables et analyse multivariée de données mixtes issues d’une étude BCI


Jérôme Saracco
ENSC - Bordeaux INP

Marie Chavent
Université de Bordeaux

Liliana Audin-Garcia
ENSC - Bordeaux INP

Véronique Lespinet-Najib
ENSC - Bordeaux INP

Ricardo Ron-Angevin
Universidad de Málaga
Espagne



Published on 18 December 2018   DOI : 10.21494/ISTE.OP.2018.0311

Abstract

Résumé

Keywords

Mots-clés

The aim of this work is to analyze complex data from a Brain Computer Interfaces (BCI) study using
multivariate statistical methods (PCAmix approach and clustering of variables) to better understand and interpret their
relationships. This article presents clustering of variables which aim is to lump together strongly related variables. The
proposed approach works on a mixed data set, i.e. on a data set which contains numerical variables and categorical
variables. Two algorithms of clustering of variables are described : a hierarchical clustering and a k-means type clustering.
A brief description of PCAmix method (that is a principal component analysis for mixed data) is provided, since the calculus
of the synthetic variables summarizing the obtained clusters of variables is based on this multivariate method. Finally, the
PCAmix and ClustOfVar approaches (implemented in the R packages ClustOfVar and PCAmixdata) are illustrated on a
real dataset from a BCI (brain computer interface) study. Recommendations, based not only on performance, efficiency,
but also on satisfaction criteria, could be made concerning the choice of interface in the use of virtual keyboards, especially
for people with motor disorder such as Charcot’s disease.

L’objectif de ce travail est de traiter des données complexes issues de la technique des Brain Computer Interfaces
(BCI) au moyen de méthodes statistiques multivariées (approche PCAmix et classification de variables) afin de mieux
comprendre et interpréter les relations qui existent entre elles. Cet article présente ainsi la classification de variables qui
a pour but de réunir des variables fortement liées entre elles. L’approche proposée fonctionne avec des données mixtes,
c’est à dire des données contenant des variables numériques et des variables catégorielles. Deux algorithmes de classification
de variables sont décrits : un de classification hiérarchique et un autre de partitionnement de type k-means. Une
rapide description de la méthode PCAmix (qui permet de faire de l’analyse en composantes principales pour des données
mixtes) est fournie, vu que le calcul des variables synthétiques résumant les classes de variables obtenues est fondé sur
cette méthode multivariée. Enfin, les approches PCAmix et ClustOfVar (implémentées dans les packages R ClustOfVar
et PCAmixdata) sont mises en oeuvre sur les données réelles issues de l’étude BCI. Des recommandations, reposant non
seulement sur des critères de performances, d’efficience mais aussi de satisfaction, ont pu être faites concernant le choix
d’interface dans l’usage des claviers virtuels, notamment pour des personnes avec des problèmes moteurs tels que la
maladie de Charcot.

clustering of variables mixed data principal component analysis for mixed data R packages brain computer interface multivariate data analysis data visualization

Classification de variables données mixtes analyse en composantes principales packages R brain computer interface analyse multivariée des données visualisation des données